과학기술에 특화된 생성형 거대언어모델 나왔다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한국과학기술정보연구원(KISTI)은 과학기술데이터에 특화되고, 출연연과 공공기관에서 활용하기 쉬운 생성형 거대 언어 모델(LLM)인 'KONI(고니) 13b'를 개발했다고 20일 밝혔다.
김재수 KISTI 원장은 "코니를 기존 과학기술정보 유통, 분석체계를 획기적으로 개선해 일반 대중과 전문과학자 모두가 활용할 수 있는 공학박사 수준의 AI 정보 서비스 체계를 구축할 계획"이라며 "향후 AI를 통해 가설을 세우고 과학적 발견까지 지원해 실제 연구에서 활용할 수 있도록 확대해 나가겠다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
보안, 비용 등 문제 해결..출연연-공공기관 활용
한국과학기술정보연구원(KISTI)은 과학기술데이터에 특화되고, 출연연과 공공기관에서 활용하기 쉬운 생성형 거대 언어 모델(LLM)인 'KONI(고니) 13b'를 개발했다고 20일 밝혔다.
생성형 AI인 챗GPT와 같은 LLM 기술은 다양한 사용자의 질의에 풍부한 답변을 할 수 있어 지난해 11월 출시되자마자 커다란 관심을 받았다. 국내에서도 네이버, KT, LG AI 연구원 같은 대기업들을 중심으로 여러 LLM들이 개발됐다.
하지만, 민감 정보나 보안 등의 문제를 중요시하는 출연연, 공공기관이나 비용 문제로 도입을 망설이던 중소기업은 LLM 을 활용하는데 한계가 있었다.
KISTI는 보안이나 정보 유출에 안전하면서 기존 LLM이 갖는 환각 현상을 최소화하고, 과학기술·산업 분야에 특화된 모델 개발이 쉬운 코니를 개발했다. 코니는 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용하는 검색 증강 생성 기술(RAG)을 적용했다. 또한 PEFT(매개변수 효율적 미세조정) 기법을 도입해 파인 튜닝 시 요구되는 전산 비용을 줄이면서 다양한 분야의 LLM 수요에 빠르게 대응할 수 있도록 구현했다.
KISTI는 출연연, 공공기관, 중소기업 등에 코니를 지원하고, 앞으로 모델 성능을 130억개 파라미터 수준의 모델 크기로 늘리고 학습 데이터를 추가 확보해 성능을 지속적으로 높여 나갈 계획이다.
김재수 KISTI 원장은 "코니를 기존 과학기술정보 유통, 분석체계를 획기적으로 개선해 일반 대중과 전문과학자 모두가 활용할 수 있는 공학박사 수준의 AI 정보 서비스 체계를 구축할 계획"이라며 "향후 AI를 통해 가설을 세우고 과학적 발견까지 지원해 실제 연구에서 활용할 수 있도록 확대해 나가겠다"고 말했다.이준기기자 bongchu@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- 조민, 이번엔 화장품 엠버서더로…누리꾼들 "아름답다"
- 테슬라 차 맞아?…"이 정도 한파에 뒷유리 `와장창`"
- `부산 돌려차기` 가해자, 전 여친에 협박 편지 혐의 인정
- "이효리가 비행기 옆자리에"…희소병 유튜버 `뭉클` 영상
- 검찰 `압구정 롤스로이스` 징역 20년 구형…"사죄 없다"
- [임기반환점 맞은 尹] 4대 개혁 과제 속에 낮은 지지율 걸림돌
- 영끌족 `눈물의 경매`… 서울 아파트 9년만에 최고치
- 최태원, 페루 이어 일본·중국行… 글로벌 리더십 `광폭 행보`
- 통신3사, 5G·비통신으로 3분기도 호실적… AI 수익화 `박차`
- 보험사, 新회계 논란에 시작된 `눈치싸움`