KISTI, 생성형 언어 모델 KONI 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한국과학기술정보연구원(KISTI)은 20일 과학기술데이터에 특화되고, 출연연, 공공기관에서 활용하기 쉬운 생성형 거대 언어 모델(LLM)인 KONI(KISTI Open Natural Intelligence, 한글명 고니) 13b를 개발했다고 이날 밝혔다.
김재수 원장은 "이번 KONI 13b 개발을 통해 KISTI는 다양한 과학기술·산업 분야의 LLM 수요에 대응하고, 외부 기관들과 협력 체계를 구축하고, 사용자 피드백 등을 반영해 KONI 모델의 성능을 계속 개선할 예정"이라고 했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[이데일리 강민구 기자] 한국과학기술정보연구원(KISTI)은 20일 과학기술데이터에 특화되고, 출연연, 공공기관에서 활용하기 쉬운 생성형 거대 언어 모델(LLM)인 KONI(KISTI Open Natural Intelligence, 한글명 고니) 13b를 개발했다고 이날 밝혔다.
하지만, 민감 정보나 보안 등의 문제를 중요시하는 출연연, 공공기관이나 비용 문제로 도입을 망설이던 중소기업은 이들을 활용하는데 문제점을 보여왔다. 이러한 문제점을 해결하기 위해 KISTI는 보안이나 정보 유출에 안전하면서도, 기존 LLM이 갖는 환각 현상을 최소화하고, 과학기술·산업 분야에 특화된 모델 개발이 쉬운 KONI를 개발했다.
KONI는 LLM에서 일반적으로 발생하는 환각 현상을 최소화하기 위해 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용하는 검색 증강 생성 기술(RAG)을 적용하기 쉽게 개발됐다.
또한, PEFT(Parameteric Efficient Fine Tuning) 기법을 도입해 파인 튜닝 시 요구되는 전산 비용을 줄이면서도 다양한 분야의 LLM 수요에 빠르게 대응하기 위한 LLM 모델을 개발했다.
KISTI는 앞으로 출연연, 공공기관, 중소기업에 대한 LLM 지원을 할 예정이다. 모델 성능도 현재 130억개 파라미터 수준의 모델 크기를 늘리고, 학습 데이터도 추가로 확보해 계속 향상시킬 계획이다.
김재수 원장은 “이번 KONI 13b 개발을 통해 KISTI는 다양한 과학기술·산업 분야의 LLM 수요에 대응하고, 외부 기관들과 협력 체계를 구축하고, 사용자 피드백 등을 반영해 KONI 모델의 성능을 계속 개선할 예정”이라고 했다.
김 원장은 “국가과학기술데이터 서비스 분야에서도 KONI 13b를 통해 기존 과학기술정보 유통, 분석 체계를 개선해 대중과 전문과학자 모두 활용할 수 있는 공학박사 수준의 AI 정보 서비스 체계를 구축해 나가겠다”며 “향후 AI를 통해 가설을 세우고 과학적 발견까지 지원해 실제 연구에서도 활용하도록 확대할 예정”이라고 했다.
강민구 (science1@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
- 日 반도체의 몰락, '도시바' 상장폐지…역사 뒤안길로
- [단독]삼성디스플레이 성과급, 기본급 100% 받는다
- “쉿 비밀” 부산행 SRT서 담배 ‘뻑뻑’…라이브 방송까지
- "김하성 주장 사실과 다르다"…`폭행 논란` 임혜동, 경찰 출석
- 홀로 인도 여행하다 성추행당한 女유튜버...가해자 체포
- 남의 축사 침입해 어미소 수간한 男...“동물과 성행위 금지해야”
- 내일 `역대급 한파` 온다…서울 체감온도 `영하 21도`
- 사라진 붕어빵 여기서…"붕세권"으로 뜬 이곳
- 한파 속 설악산 등반한 남녀 2명…결국 숨진 채 발견
- 이강인 비판에 대한 엔리케 PSG 감독의 대답..."그는 팀에 중요한 선수"