"책 420만권 학습"… 솔트룩스 `루시아` 생성형AI 시장 진격
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
또 하나의 국산 LLM(대규모언어모델)이 베일을 벗었다.
솔트룩스는 7일 서울 코엑스에서 'SAC(솔트룩스 AI 컨퍼런스) 2023'을 열고 자사 LLM(대규모언어모델) '루시아(LUXIA)'를 소개했다.
그는 "기사 저작권은 보호돼야 한다고 생각한다"며 "솔트룩스는 마치 유튜브처럼 원저작자와 수익을 나누는 방향을 추구할 방침으로, 블록체인 기술을 접목해 사용자가 모델 학습에 기여한 만큼 혜택을 제공하는 형태도 내년 선보일 계획"이라고 덧붙였다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
챗GPT보다 환각 40% 넘게 줄여
이경일 대표 "글로벌기업 포함
80여곳 도입 문의… 매출 기대"
또 하나의 국산 LLM(대규모언어모델)이 베일을 벗었다. 독자적인 기술을 바탕으로 할루시네이션을 줄이고 각 전문영역에 특화된 모델로 B2B(기업간 거래) 생성형AI(인공지능) 시장 공략에 나선다.
솔트룩스는 7일 서울 코엑스에서 'SAC(솔트룩스 AI 컨퍼런스) 2023'을 열고 자사 LLM(대규모언어모델) '루시아(LUXIA)'를 소개했다. 올해 초 금융권 컨퍼런스에서 공개된 적 있지만 생태계까지 함께 선보인 것은 이번이 처음이다.
'루시아'는 도서 420만권 분량인 한국어 말뭉치 1TB(테라바이트)를 학습했다. 솔트룩스가 그동안 AI학습용 데이터를 구축하며 축적해온 것도 포함됐다. 영어 데이터도 그에 준하는 수준으로 학습했고, 일본어·중국어·스페인어 등으로 학습 범위를 넓혀갈 계획이다.
이경일(사진) 솔트룩스 대표는 "하나의 언어에 대해 대략 1000억 토큰 정도로 임계값이 넘어가면 해당 언어 생성 용도로는 더 배울 게 없다. 어차피 LLM에는 벡터로 인식되기에 외려 언어장벽이 없어진다"며 "한국어 데이터 자체가 많지 않을 뿐더러 지식과 문맥을 갖추려면 영어는 물론 다양한 언어를 익히는 게 좋다"고 설명했다.
솔트룩스는 '루시아'의 특징으로 할루시네이션 최소화를 꼽았다. 사람이 지식의 기호화·외장화로 망각·착각을 극복하듯 뉴로-심볼릭 기법을 적용, '지식그래프'를 활용한 사실·지식 그라운딩과 RAG(검색증강생성)이라는 2가지 접근법을 연계했다. 이를 기반으로 자체적으로 연구개발한 IKL(인스트럭트지식학습)을 통해 챗GPT(GPT-3.5 기준)보다 할루시네이션을 43% 줄였다는 게 회사의 설명이다.
'루시아'는 파라미터 규모 70억·130억·200억·500억개의 4종으로 제공되며, 연내에 토큰 1조개 수준의 1000억개 파라미터를 지닌 모델도 추가될 예정이다.
여기에 △노코드 기반 언어모델 구축 솔루션 '랭귀지 스튜디오' △인지검색 솔루션 '서치 스튜디오' △지식그래프 솔루션 '날리지 스튜디오' 등이 함께 구성됐다. 이를 통해 기업들이 내부 데이터를 학습시켜 자체적인 모델을 마련할 수 있도록 돕는다. 이를 위한 클라우드 기반으로 AWS(아마존웹서비스)와 협업 중이며, 자체 데이터센터 내에 설치를 원하는 고객을 위해 어플라이언스도 이달 말부터 공급할 계획이다.
이 대표는 "국내 제조기업과 금융기업, 글로벌 기업까지 고객으로 확보하며 이미 매출이 발생하고 있다. 도입을 문의하는 거대기업만 80여 곳으로, 내년 6월까지 계속 매출이 증가할 것으로 기대한다"고 말했다. 솔트룩스 측은 내년 매출의 절반 이상은 LLM 기반으로 올릴 것으로 내다보면서 30~40% 이상 증가할 것으로 예상했다.
한편 이 대표는 뉴스를 비롯한 학습용 데이터 사용료에 대한 입장도 밝혔다. 그는 "기사 저작권은 보호돼야 한다고 생각한다"며 "솔트룩스는 마치 유튜브처럼 원저작자와 수익을 나누는 방향을 추구할 방침으로, 블록체인 기술을 접목해 사용자가 모델 학습에 기여한 만큼 혜택을 제공하는 형태도 내년 선보일 계획"이라고 덧붙였다.
팽동현기자 dhp@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- "우편함서 30만원 공연 티켓 훔쳐가"... 개 산책 나와 우편물 절도한 女
- "이재명은 굶고 있는데…옆에서 간식 팔아?" 분노한 지지자들
- 日정부, 통일교에 해산명령 수순 밟나...과태료 부과 조치 착수
- "갓 제대한 군인이라더니"...영업정지 국밥집 사장 "가장 5명 생계 잃어"
- 버스 기다리던 여성에 전기 충격기 찌른 40대男... "써보고 싶어서"
- 韓 "여야의정 제안 뒤집고 가상자산 뜬금 과세… 민주당 관성적 반대냐"
- [트럼프 2기 시동] 트럼프, 김정은과 협상할까… "트럼프 일방적 양보 안 할 것"
- 내년 세계성장률 3.2→3.0%… `트럼피즘` 美 0.4%p 상승
- `범현대 3세` 정기선 수석부회장, HD현대 방향성 주도한다
- "AI전환과 글로벌경쟁 가속… 힘 합쳐 도약 이뤄야"