"기업 LLM 수요 잡아라"… AI 틈새시장 노린 中企

팽동현 2023. 9. 11. 17:34
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

업스테이지, 언어모델 구축 협약
코난테크놀로지, 자체LLM 구축
이건수(왼쪽) 커넥트웨이브 대표집행임원과 김성훈 업스테이지 대표가 지난 8일 프라이빗 LLM 구축 계약을 맺고 기념촬영하고 있다. 업스테이지 제공
이경일 솔트룩스 대표가 지난 7일 열린 SAC 2023 컨퍼런스의 기조연설에서 자사 생성형AI 솔루션을 소개하고 있다. 솔트룩스 제공

글로벌 빅테크들의 전장으로 여겨져 온 생성형 AI(인공지능) 분야에 국내 중소 SW(소프트웨어) 기업들의 도전이 이어지고 있다. 이들 기업은 주로 각 산업영역에 특화되고 경량화로 부담을 낮춘 AI모델을 선보이며 B2B(기업간 거래) 시장 공략에 집중한다.

AI 스타트업 업스테이지는 가격비교 서비스업체 다나와 및 에누리를 운영하는 커넥트웨이브와 국내 이커머스 업계 최초로 생성형AI 기반 '프라이빗 LLM(대규모언어모델)' 구축 계약을 체결했다고 11일 밝혔다.

커넥트웨이브는 보유한 약 14억개의 한국어 기반 쇼핑상품 데이터를 업스테이지 AI모델에 접목, 자체 LLM을 개발해 내재화할 계획이다.

'프라이빗 LLM'으로 불리는 사내 구축형 AI 모델은 통상 퍼블릭 클라우드를 통해 제공되는 챗GPT 등 주요 생성형AI에 비해 개인정보나 기밀정보 유출 우려를 덜 수 있다는 것이 장점이다. 기업 내부 데이터를 학습해 할루시네이션(환각) 현상을 줄이면서 목적·용도에 맞게 특화시킬 수 있다는 점에서 기업들의 주목을 받고 있다. 10일 KT가 업스테이지와 교육AI 스타트업 콴다에 200억원 규모 투자를 발표했는데, 업스테이지와의 협력내용에 프라이빗 LLM 개발이 포함되기도 했다.

앞서 업스테이지는 해외 머신러닝 스타트업 허깅페이스가 평가한 '오픈LLM 리더보드'에서 1위를 차지했다. 메타가 공개한 LLM '라마' 기반으로 두 달여 간 파인튜닝 등을 거쳐 자체 AI모델로 만들어 거둔 성과다.

이와 달리 처음부터 LLM을 자체 구축해 B2B 수요 공략에 나선 기업들도 있다. 코난테크놀로지와 솔트룩스가 대표적으로, 두 곳 다 과거엔 B2B 검색엔진 솔루션을 주로 개발·공급했다. 그만큼 NLP(자연어처리)와 챗봇서비스 역량을 탄탄하게 갖추고 있다. 두 기업은 자체 검색 서비스 연동을 통해 할루시네이션을 줄이려는 시도도 진행중이다.

SK텔레콤의 'K-AI얼라이언스' 멤버인 코난테크놀로지는 지난달 '코난LLM'을 선보였다. 파라미터(매개변수) 규모 131억개로, 오는 11월에는 410억개 모델도 선보일 예정이다. 모델 크기를 경량화해 다수의 GPU(그래픽처리장치) 서버 없이 엔비디아 RTX3090에서도 구동 가능하게 했으며, 기업 내부 구축형으로 제공할 계획이다. 코난LLM은 전체 토큰이 4920억개로, 특히 한국어 토큰 2840억개를 학습해 한국어 품질을 높인 것을 강점으로 내세운다. 11월 선보일 모델에는 전체 7000억개, 한국어 3220억개 토큰이 쓰인다.

솔트룩스는 이달 7일 자체 컨퍼런스를 열고 자사 LLM '루시아'와 연관 생태계를 발표했다. '루시아'는 도서 420만권 분량인 한국어 말뭉치 1TB(테라바이트)를 학습했으며, 영어 데이터도 그에 준하는 수준으로 학습해 전체 품질 향상에 주력했다.

사람이 지식의 기호화·외장화를 통해 망각과 착각을 극복하듯 뉴로-심볼릭 기법을 적용해 할루시네이션을 최소화한 것을 강점으로 꼽았다.

파라미터 70억·130억·200억·500억개 4종으로 제공되며, 연내 토큰 1조개 수준, 파라미터 1000억개 모델도 내놓을 예정이다. 자체 데이터센터 내 설치를 원하는 고객을 위한 어플라이언스 제품을 이달 말부터 공급하는 것도 눈에 띈다.글로벌에서 자체 개발 LLM으로 B2B 시장 공략에 주력하는 스타트업 중 대표적인 곳은 코히어(Cohere)다. 트랜스포머 구조를 처음 소개한 구글 논문의 공동저자 중 한 명이 CEO를 맡고 있고, 오라클과 기업용 생성형AI 파트너십을 맺었다. 지난 6월 시리즈C 라운드의 일환으로 2억7000만달러(약 3594억원)를 조달, 현재 기업가치는 21억달러(약 2조8000억원) 이상으로 평가된다.

이경일 솔트룩스 대표는 "국내 제조기업과 금융기업, 글로벌 기업까지 루시아의 고객으로 확보하며 이미 매출이 발생하고 있다. 도입을 문의하는 거대기업만 80여 곳으로, 내년 6월까지 계속 매출이 증가할 것으로 기대한다"고 말했다.

팽동현기자 dhp@ dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?