"한국어 AI, 네카오에 안 말린다" 25년 업력의 이 기업
전체 학습 토큰 1조개, 한국어 토큰 5000억개 이상 확보
[서울=뉴시스] 오동현 기자 = 초거대언어모델(LLM) 개발 분야에서 네이버·카카오 등 국내 빅테크 기업과의 경쟁을 자신하는 인공지능(AI) 전문 중소기업이 있다. 작년 7월 코스닥 시장에 상장한 코난테크놀로지다.
네이버가 오는 8월 24일 초거대AI '하이퍼클로바X' 공개를 예고한 가운데 코난테크놀로지는 오는 3분기 중 코난 LLM의 개발을 완료해 발표하겠다는 목표를 밝혔다. 이 기간 내 파라미터(매개변수) 200억 개 이상의 모델을 확보하는 것이 코난 LLM의 개발 타임라인이다.
코난테크놀로지는 '코난 GPT'와 '코난 챗GPT(가제)'를 필두로 한 LLM 개발에 박차를 가하고 있다. 코난테크놀로지의 LLM은 기존의 챗GPT와 하이퍼클로바 API(응용 프로그래밍 인터페이스)에 의존하는 다른 회사와 차별화된다. 코난 GPT의 경우 전체 학습 토큰(말뭉치)은 1조개 이상, 이 중 한국어 토큰은 5000억 개 이상을 확보했다.
4일 정보기술(IT) 업계에 따르면 코난테크놀로지가 확보한 한국어 토큰 5000억 개는 국내 빅테크 기업과도 견줄만한 수준이다. 네이버의 경우 하이퍼클로바 개발을 위해 5600억개 토큰의 한국어 대용량 데이터를 구축했다. 카카오의 코(Ko)GPT는 2000억개 토큰의 한국어 데이터를 학습했다.
코난테크놀로지 관계자는 "챗GPT 열풍 이후 빠르게 증가하는 관심과 비즈니스 수요에 부합하고자 생성형 AI 개발에 속도를 내고 있다"며 "우선 1차적으로 이달 중순 파라미터 130억 개 학습에 전체 토큰 5450억개, 한국어 3940억개를 사용해 발표할 계획"이라고 전했다.
이어 "8월 초 학습을 시작해 10월~11월 중 마무리할 파운데이션 모델의 파라미터는 200억 개 또는 400억 개로 계획하고 있다. 여기에 사용될 전체 토큰이 7440억개, 한국어 토큰은 5961개"라며 "현재는 파라미터 타임라인에 따른 토큰 수와의 최적 조합을 계속해서 찾는 과정"이라고 전했다.
이를 위해 코난테크놀로지는 지난 2월 국내서 가장 먼저 엔비디아의 최신 GPU 'H100' 장비 8대를 발주했다. 대량의 데이터와 파라미터 기반의 LLM 학습에는 고성능 GPU 서버가 필요하기 때문이다. 개발인력도 지난해 120명에서 올해 157명으로 지속적으로 증원 중이다. 지난 3월말 기준 전체 임직원 수가 206명인 점을 감안하면 개발인력 비중이 절반을 넘는다.
코난테크놀로지는 1999년 4월 설립돼 검색엔진 및 비정형 빅데이터 분석 분야에서 기술력을 축적한 AI 솔루션 전문 기업이다. 오픈소스가 아닌 자체 기술로 개발한 AI 원천기술을 바탕으로 자연어를 처리하는 텍스트 AI와 AI로 영상을 분석하는 비디오 AI 영역에서 기술력을 확보하고 있다.
또한 2007년부터 운영한 PulseK AI 분석 서비스를 통해 축적된 약 205억건의 고품질의 한국어 데이터도 갖추고 있다. 특히 매년 매출의 30~50% 수준을 AI 관련 R&D에 투자하고 있는 것으로 알려졌다. 2018~2021년 연평균 성장률은 18%에 이르며, 23년의 오랜 업력을 바탕으로 5년 이상 장기 고객 매출 비중이 55%에 달한다. 지난해 연간 매출은 154억원이다.
코난테크놀로지는 SK텔레콤과도 긴밀하게 협력하고 있다. 지난해 10월 SK텔레콤은 SK커뮤니케이션즈가 보유한 코난테크놀로지 지분 20.77%를 224억 원에 인수했다. 이에 SK텔레콤은 23.9%의 지분을 보유한 김영섬 코난테크놀로지 대표에 이어 2대 주주가 됐다.
최근엔 SK텔레콤과 다양한 AI 프로젝트 성과들을 구체화해 나가고 있다. 양사는 지난해 10월 'AI 기술협력 MOU 체결' 이후 AI 사업 시너지 및 인력 교류를 강화하며 SK텔레콤의 '에이닷(A.)' 품질 고도화 및 인공지능 컨택센터(AICC), 비전 AI, AI 반도체, 디지털 트윈 등 여러 분야에서 기술협력을 수행해 왔다.
이와 관련해 코난테크놀로지와 SK텔레콤은 지난 5월과 6월에 총 12억원대 규모의 계약을 체결했다. 해당 계약들은 ▲'생성형 AI 기반 딥메타 기술 개발' ▲'한국어 자막 FA 개선 및 검수 기능 개발' 등이다.
코난테크놀로지와 협력하는 SK텔레콤도 자체 LLM을 고도화하고 있다. 에이닷 이용자와 단답형 대화가 아닌, 맥락을 이해하고 복잡한 의도를 파악하며 연속적으로 말을 주고 받을 수 있는 멀티턴 방식의 대화로 보다 논리적이고 유용한 답변을 제공한다.
김영섬 코난테크놀로지 대표이사는 "자체 개발 AI 원천 기술력을 기반으로 앞으로도 SK텔레콤 및 SK그룹사와 전방위적으로 협업해 AI 비즈니스 시장 창출에 몰두하겠다"고 밝혔다.
또 "차별화 된 환경에서 자체개발 초거대 AI언어모델을 출시해 회사의 기밀이나 개인정보 보안 등이 중요한 B2G, B2B시장에 성공적으로 진출하겠다"는 포부를 전했다.
☞공감언론 뉴시스 odong85@newsis.com
Copyright © 뉴시스. 무단전재 및 재배포 금지.
- 여에스더 "재력가 父, 중앙정보부에 끌려가 풍비박산"
- 서정희, 딸 서동주보다 먼저 재혼? "매일 웨딩드레스 입는 상상"
- 최준희, 눈·코 고쳤는데…양악수술 상담 받았다
- "김건희 패러디 때문에 SNL 하차?" 주현영, 의혹에 입 열었다
- "얘 아는 사람?ㅋㅋ"…이석준, '계엄 옹호' 차강석 공개 저격
- "1년 수익 32만원" 안상태, '층간소음' 누명 이후 근황
- "K사 브랜드 전략실서 일해요"…24기 옥순 직업 논란 터졌다
- 모모, 가슴골 파인 드레스로 반전 볼륨…섹시+상큼 동시에
- 김성은, ♥정조국과 안타까운 이별…"독박육아 시작"
- '15년 공백기' 원빈 근황…여전한 조각 미남