코난테크놀로지, 자체 AI 언어모델 '코난 LLM' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
코난테크놀로지가 자체 개발한 대규모 언어모델 '코난 LLM'을 공개했다.
코난 LLM은 전체 토큰(LLM이 인식하는 문자 데이터 단위) 4920억개, 한국어 토큰 2940억개를 학습했다.
코난테크놀로지는 오는 11월 전체 학습 토큰 7000억개, 한국어 토큰 3220억개를 사용한 후속 모델을 발표한다는 계획이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
코난테크놀로지가 자체 개발한 대규모 언어모델 '코난 LLM'을 공개했다.
코난 LLM은 전체 토큰(LLM이 인식하는 문자 데이터 단위) 4920억개, 한국어 토큰 2940억개를 학습했다. 파라미터(매개변수) 131억개, 410억개 버전으로 구분된다. 파라미터 사이즈를 줄이고 학습 토큰을 늘려 비용은 합리화하고 성능은 최대한 높였다.
코난 LLM은 △문서 초안 생성 △문서 요약 △질의응답을 지원한다. 각종 문서, 보고서, 보도자료 등 초안을 빠르고 손쉽게 생성하며 작업 생산량을 대폭 높인다. 콘텍스트 길이가 큰 것이 특징이다. 한 번에 보다 긴 글을 생성할 수 있다.
온프레미스(사내구축형)로 기업과 정부에 공급한다. 라이선스 또는 연간 구독 모델로 판매한다. 보안이 강점이다. 온프레미스로 제공하는 만큼 기업이나 정부 내부 데이터 유출을 막을 수 있다. 허위 정보를 생성하는 '할루시네이션'까지 줄였다. 벡터 검색 기반 '코난 서치'를 연동해 답변과 함께 명확한 근거 및 출처를 참고문서 형태로 제시한다.
임완택 코난테크놀로지 전략기획본부 상무는 “기업과 정부 기관에서 코난 LLM에 대한 관심이 크다”면서 “지속적으로 코난 LLM을 설명하고 활용 방안을 제시하고 있다”고 말했다.
코난테크놀로지는 오는 11월 전체 학습 토큰 7000억개, 한국어 토큰 3220억개를 사용한 후속 모델을 발표한다는 계획이다.
김영섬 코난테크놀로지 대표는 “생성 인공지능(AI) 시장에 빠르게 대응하기 위해 기술 개발과 장비 투자를 이어왔다”면서 “기술 고도화에 지속 매진할 것”이라고 강조했다.
류태웅 기자 bigheroryu@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 카드 3사, 데이터 사업 본격화…새 부가가치 창출
- NHN클라우드 데이터센터 지방 설립 난항
- 국산 'AI반도체' 밀착지원…UAM, 배터리 구독 등 신산업 육성
- 이탈리아, '꽃게와의 전쟁' 왜?…“봉골레 파스타 못 먹을까 봐!”
- 尹, 한미일 정상회의 위해 출국…3국간 안보협력체 출범
- 서정진 “셀트리온 합병, 2030년 매출 12조…빅파마 도약”
- [제4회 전자신문 캐드경진대회]디지털설계 우수 인력 '등용문'으로 우뚝
- 무신사, 사내 복지 제도 손질…어린이집·재택근무 '재검토'
- 애플, '탈중국' 가속…인도서 '아이폰 15' 생산 시작
- 멕시코 주지사, 이달 방한…韓자동차 부품사 현지 공급망 강화