[AI시대, 가치 네트워크에 주목하라] 방대한 과학기술 데이터 학습...공학박사 수준 `AI 에이전트`로

이준기 2024. 8. 20. 18:45
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"고니(KONI)가 '협력 과학자(Co-Scientist)' 또는 공학박사 수준의 AI 연구자로 활약하도록 고도화하는 게 목표입니다."

이경하(사진) 한국과학기술정보연구원(KISTI) 초거대AI연구단장은 본지와의 인터뷰에서 과학기술에 특화된 생성형 거대언어모델(LLM)인 '고니'의 개발 방향에 대해 이같이 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

이경하 단장 "고도화 목표"
이경하 KISTI 초거대AI연구단장

"고니(KONI)가 '협력 과학자(Co-Scientist)' 또는 공학박사 수준의 AI 연구자로 활약하도록 고도화하는 게 목표입니다."

이경하(사진) 한국과학기술정보연구원(KISTI) 초거대AI연구단장은 본지와의 인터뷰에서 과학기술에 특화된 생성형 거대언어모델(LLM)인 '고니'의 개발 방향에 대해 이같이 밝혔다. 이 단장은 지난해 12월 첫 선을 보인 고니 개발을 이끌어온 AI 전문가로, 지난 3월부터 신설된 초거대AI연구단을 이끌고 있다.

그는 "KISTI가 보유한 과학기술정보 데이터를 학습시켜 개발한 고니는 출연연과 공공기관, 중소기업 등에 보급·활용을 지원하기 위해 지난해 '과학기술정보 LLM 개발사업'을 통해 개발하기 시작했다"고 설명했다.

고니는 이미지 기반 학술정보(130만건)를 비롯해 논문 전문(84만건), 표·그림 설명(330만건), 질의응답(30만건), 참고문헌 속성 분리(380만건), 논문 사사정보(8만건) 등 방대한 양의 과학기술 데이터를 토대로 개발되고 있다. 논문과 보고서, 특허 정보 등의 텍스트를 활용해 성능을 향상시켰으며, 향후 그림이나 도표, 수식, 화학식 등 다양한 비텍스트 기반 과학기술 데이터를 이해하고 분석할 수 있는 고성능 멀티모달 기능을 학습에 적용해 성능을 높일 예정이다.

이 단장은 "LLM에서 일반적으로 발생하는 환각 현상을 최소화하기 위해 기존 정보서비스 시스템이 보유한 데이터를 답변 제공에 활용하는 '검색 증강 생성 기술(RAG)'을 쉽게 적용할 수 있다는 점도 고니의 또다른 특징"이라며 "매개변수 효율적 미세조정(PEFT) 기법을 도입해 파인튜닝 시 요구되는 전산비용을 절감할 수 있고, 다양한 분야에서 LLM 수요에 맞춰 빠르게 활용할 수 있도록 구현됐다"고 강조했다.

KISTI는 고니가 소형거대언어모델(sLLM)로서 개별 도메인별로 널리 활용될 수 있도록 보급·확산에 힘쓰고 있다. 이를 위해 고니를 오픈소스로 공개하고, 과학계뿐 아니라 산학연관군 등 다양한 생태계로 활용 범위를 넓혀가고 있다. 대표적으로, 지난해 육군 군수사령부와 업무협약을 체결하고 고니를 국방 분야의 AI 모델로 활용하도록 지원했고, 한국전력연구원과 업무협약을 맺고 협력해 나갈 방침이다.

이 단장은 "앞으로 연구자들이 고니를 통해 기존 연구들의 문제점을 파악한 뒤 새로운 가설을 수립해 연구 및 실험 계획을 자동으로 세워 새로운 과학적 발견까지 하도록 지원할 계획"이라며 "이를 위해 실제 연구 수행을 지원하는' AI 에이전트'로 고니의 성능을 지속적으로 높여 나가겠다"고 말했다.

KISTI는 고니를 자체 운영하고 있는 과학기술 지식정보 서비스 포털인 '사이언스 온'과 오픈 액세스 플랫폼인 액세스온 등에 올해 말까지 탑재해 보다 향상된 지능형 서비스를 일반 국민과 산학연관에 서비스할 계획이다.

그는 "앞으로 멀티모달과 추론, 계획 분야의 성능을 갖춰 과학기술정보 분석·생성을 지원하고 외부 지식자원을 활용해 AI 모델의 정확도를 높이는 초거대 다국어 지원 모델로 고니를 한층 고도화시키는 연구도 병행해 나갈 것"이라고 말했다.글·사진=이준기기자 bongchu@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?