과기 특화 생성형 언어모델 '고니' 새버전…연구 혁신 가속화 기대
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한국과학기술정보연구원(KISTI·원장 김재수)은 과학기술 특화 생성형 거대 언어 모델(LLM) '고니(KONI)' 새로운 버전을 공개한다고 31일 밝혔다.
KISTI는 앞으로도 국가 과학기술 정보를 지속적으로 수집하고 이를 기반으로 성능이 향상된 새로운 버전의 다양한 모델 크기 고니를 주기적으로 공개할 계획이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
한국과학기술정보연구원(KISTI·원장 김재수)은 과학기술 특화 생성형 거대 언어 모델(LLM) '고니(KONI)' 새로운 버전을 공개한다고 31일 밝혔다. 과학기술 관련 업무를 수행하는 누구나 사용할 수 있다.
KISTI는 다양한 국가 과학기술 빅데이터를 지속 수집·분석해 과학기술에 특화된 LLM 개발을 선도하고 있다. 이번에 공개한 새 버전은 사전학습 LLM인 'KONI-Llama3-8B', 챗(Chat) 모델인 'KONI-Llama3-8B-Instruct' 두 버전이다.
이번 모델들은 기존 대비 2배 이상 과학기술정보를 포함하는 데이터를 학습해 추론, 글쓰기, 이해 등 다양한 작업에서 성능이 크게 향상됐다.
한국어 LLM 종합 사고력을 측정하는 'LogicKor' 벤치마크 리더보드에서 동일 크기 LLM 중 1위를 달성했다. 특히 8B 모델 크기의 고니가 70B 이하 LLM 중 처음으로 LogicKor 점수 8점을 넘는 8.21점을 기록했다. 한국어 LLM 개발에 새로운 이정표를 제시했다.
또 KISTI는 LLM에서 흔히 발생하는 '환각 현상'을 최소화하기 위한 검색 증강 생성 기술(RAG)을 보유하고 있다. RAG 기술을 고니와 연계해 향상된 신뢰성의 질의응답 시스템을 개발했고, 과학기술 관련 법령, 규정, 지침을 대상으로 해 KISTI 내부에서 성능을 검증했다.연구원들의 다양한 피드백을 수집해 추가 학습함으로써 성능을 더욱 향상시켰다.
KISTI는 앞으로도 국가 과학기술 정보를 지속적으로 수집하고 이를 기반으로 성능이 향상된 새로운 버전의 다양한 모델 크기 고니를 주기적으로 공개할 계획이다.
과학기술 정부출연연구기관(출연연)뿐 아니라, KISTI와 협력 중인 국방, 전력, 정책 등 여러 공공기관의 수요를 반영한 도메인 특화 LLM 또한 개발·보급할 계획이다.
김재수 원장은 “새로운 버전의 KONI를 통해 과학기술 및 산업 분야를 포함하는 다양한 분야에서 과학기술정보 유통과 분석 체계를 혁신적으로 개선하고, 더 나아가 연구자의 과학적 발견을 지원할 수 있는 에이전트 체계인 고니 기반 자율 연구자 AI를 구축할 계획”이라고 밝혔다.
김영준 기자 kyj85@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- SK하이닉스, 웨이퍼 붙여 400단 낸드 쌓는다
- [단독]현대차, 수소차 '넥쏘' 후속 7년 만에 나온다…내년 5월 양산
- [단독] 야놀자, '구글 트래블' 연동 시작…“외국 관광객 잡는다”
- [IP 인재산실을 가다]⑤유닉 교육센터 “쉽게 배우는 IP 프로그램으로 교육 혁신 앞장”
- 국가지식재산위원회 7기 출범…공동 위원장에 이광형 KAIST 총장
- [기획]경북 디지털 기초체력 지원사업은…혁신산업 창출 마중물
- [글로벌 AI 특허출원동향]에어로보틱스 '지능형 과일 수확량 예측 시스템'
- 尹 고용장관에 김문수 지명..방통·금융위원장은 임명 재가
- 악셀, 세라믹 단결정 소재로 반도체 소재 국산화 선봉
- 尹-韓 비공개 회동..대통령실, “尹, 韓에 애정어린 조언”