솔트룩스 AI모델 '루시아', 35B 이하 모델 평가서 1위

임유경 2024. 3. 15. 09:16
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 기업 솔트룩스(304100)는 자체 거대언어모델(LLM) 루시아가 전 세계 언어모델들을 평가하는 허깅페이스 오픈 LLM 리더보드에서 35B(매개변수 350억개) 모델 부문 1위를 차지했다고 15일 밝혔다.

루시아 한국어 모델은 한국지능정보사회진흥원(NIA) AI HUB 평가 데이터셋을 사용한 한국어 자체 검증에서도 GPT3.5-터보 및 오픈 모델들을 훨씬 뛰어넘는 검색 증강 생성(RAG) 및 요약 평가 점수를 달성했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

허깅페이스 오픈LLM 리더보드 기록
전체 모델 중엔 4위...상식·추론 능력 최고점 경신

[이데일리 임유경 기자] 인공지능(AI) 기업 솔트룩스(304100)는 자체 거대언어모델(LLM) 루시아가 전 세계 언어모델들을 평가하는 허깅페이스 오픈 LLM 리더보드에서 35B(매개변수 350억개) 모델 부문 1위를 차지했다고 15일 밝혔다.

루시아는 이 부문에서 약 77.74점의 평균 점수를 얻어 1위에 올랐다. 루시아는 특히 상식능력(HellaSwag)과 추론능력(ARC) 테스트에서 각각 91.88점, 77.47점을 받으며 기존 기록을 경신했다.

전체 초거대 모델들을 기준으로도 매개변수 50B 이상의 대규모 모델들을 제치고 전 세계 4위를 달성했다. 적은 매개변수로도 높은 성능을 갖춰, 더 효율적인 작동이 가능한 모델임을 입증받았다.

현재 21.4B 루시아 모델은 허깅페이스 업로드 3일 만에 500회 이상의 다운로드를 기록하는 등 크게 주목받고 있다. 루시아 21.4B 모델의 베이스 버전도 추가로 공개할 계획이다.

루시아 한국어 모델은 한국지능정보사회진흥원(NIA) AI HUB 평가 데이터셋을 사용한 한국어 자체 검증에서도 GPT3.5-터보 및 오픈 모델들을 훨씬 뛰어넘는 검색 증강 생성(RAG) 및 요약 평가 점수를 달성했다. RAG 기반 질의응답 정확도 90% 이상 등 우수한 성능 평가 점수를 기반으로 여러 기관 및 기업들과 빠르게 LLM 도입 사업을 추진하고 있다.

솔트룩스 관계자는 “자체 연례 행사인 올해 솔트룩스 AI 컨퍼런스에서 현재의 루시아를 압도적으로 뛰어넘는 혁신적인 LLM을 공식적으로 선보일 것”이라며 “국내 대표 인공지능 기업으로써 글로벌 AI 시장을 선점할 초격자 경쟁력을 계속해서 확보해 나가겠다”라고 말했다.

임유경 (yklim01@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?