코난테크놀로지, 초거대언어모델 '코난 LLM' 출시 속도

구자윤 2023. 7. 19. 15:14
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

코난테크놀로지가 파라미터 131억개로 자체개발 초거대언어모델(LLM) '코난 LLM' 출시에 속도를 낸다고 19일 밝혔다.

13.1B 파운데이션 모델은 파인튜닝을 거쳐 다음달 정식 출시되며 내달 1일 학습을 시작해 10월 중 마무리할 코난 LLM 파운데이션 모델의 파라미터는 400억개다.

특정 기업의 API나 오픈소스 기반이 아닌 B2B, B2G 특화로 자체 개발된 생성형 언어 모델은 코난 LLM이 처음으로 출시했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

코난테크놀로지, 초거대언어모델 '코난 LLM' 출시

코난테크놀로지가 파라미터 131억개로 자체개발 초거대언어모델(LLM) '코난 LLM' 출시에 속도를 낸다고 19일 밝혔다.

코난테크놀로지는 지난 17일 기준 전체 학습 토큰 4920억개, 한국어 토큰 2840억개로 학습을 마쳤다. 총 파라미터(매개변수)는 131억개에 달한다. 13.1B 파운데이션 모델은 파인튜닝을 거쳐 다음달 정식 출시되며 내달 1일 학습을 시작해 10월 중 마무리할 코난 LLM 파운데이션 모델의 파라미터는 400억개다. 전체 토큰 6000억개, 한국어 토큰은 4000억개로 준비 중이다.

코난 LLM은 온프레미스 제공으로 생성형 AI의 보안과 기밀유출 우려를 방지하고 B2B, B2G향 초거대 인공지능(AI)을 표방하는 점이 특징이다. B2C 기반 챗GPT의 경우 질의시 기업의 중요 기밀이 외부로 유출되는 것이 허들로 작용한다. 코난 LLM은 이러한 점을 해소하고, 해당 기업이나 기관에 최적화된 지도학습 및 강화학습을 거쳐서 문서 초안 생성, 문서 요약, 질의, 응대 등에 사용시 뛰어난 성능을 제공한다는 계획이다. 특정 기업의 API나 오픈소스 기반이 아닌 B2B, B2G 특화로 자체 개발된 생성형 언어 모델은 코난 LLM이 처음으로 출시했다.

합리적인 비용으로 고객 부담을 낮추는데도 신경 썼다. 통상 생성형 AI 학습비용은 토큰개수보다는 파라미터 개수에 더 크게 비례함에 따라 모델 파라미터의 사이즈는 줄이면서 성능을 유지하는 것이 B2B, B2G 제품에서 중요하다. 코난 LLM은 기업 수요에 따라 13.1B와 40B 파라미터 모델 중 해당 기관에 최적화된 사양을 선택하고 강화학습을 거쳐 비용은 합리적으로, 성능은 고도화한다는 전략이다.

김영섬 코난테크놀로지 대표이사는 "자체개발 초거대 언어모델 확보를 위해 24여년간의 기술력을 쏟아 부었다”며 “기업과 기관에 최적화된 모델로 시장 요구에 부응하고 온프레미스 형태로 보안을 강화시켜 생성형 AI 생태계 구축을 이끌겠다”고 말했다.

Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?