업스테이지 SLM '솔라', 챗GPT·라마2 꺾고 글로벌 최고 성능 입증

허깅페이스 오픈 LLM 리더보드 순위에서 업스테이지의 LLM 모델 ‘솔라’가 1위를 차지한 모습. 자료=업스테이지

국내 대표 인공지능(AI) 스타트업 업스테이지가 자체 개발한 사전학습 거대언어모델(Large Language Model·LLM) '솔라'가 오픈AI, 미스트랄 등 글로벌 AI 전문기업을 제치고 최고 평가를 받았다. 솔라는 매개변수를 최소화 시켜 효율성을 극대화한 것으로, 차세대 LLM 주력 모델로 손꼽힌다.

업스테이지는 14일 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM 리더보드'에서 세계 1위를 차지한 사전학습 LLM 솔라를 공개했다고 밝혔다. 이번 결과는 '소형 LLM'(SLM)의 기준이라고 할 수 있는 300억 매개변수(30B) 이하 사이즈로 글로벌 최고 성능 모델에 올라 더욱 의미가 깊다.

업스테이지는 지난 8월, 오픈LLM 역사상 최초로 GPT-3.5의 벤치마크 점수를 뛰어넘어 주목을 받은 자사의 허깅페이스 1위 모델을 시작으로 솔라 모델을 개발했다. 솔라는 'Specialized and Optimized Llm and Applications with Reliability'를 줄인 약어다. 솔라는 기업들이 활용하기 좋은 프라이빗 LLM을 위해 작은 크기로 구성된 사전학습 모델로, 세계 최초의 107억 매개변수(10.7B) 모델이다. 업스테이지는 고도의 지능과 컴팩트함이라는 완벽한 균형을 찾은 모델이라고 평가했다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력과 환각현상(할루시네이션) 방지, 대명사 참조 및 수학 해결 능력 등 6가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.

솔라는 리더보드 평가에서 74.2점을 기록하며 전체 1위를 차지하는 기염을 토했다. 이로서 업스테이지의 솔라는 알리바바의 최신 모델인 '큐원'(Qwen)의 6분의 1도 안되는 크기로 이를 훌쩍 뛰어넘는 성능을 증명했다. 또 최근 20억 달러의 기업 가치로 유니콘에 오른 미스트랄AI의 최신 모델 '믹스트랄' 모델의 성능지표마저 뛰어넘어 글로벌 무대의 이목도 집중시켰다.

허깅페이스 오픈 LLM 리더보드 사전학습 모델 순위에서 업스테이지의 LLM 모델 ‘솔라’가 1위를 차지한 모습. 자료=업스테이지

솔라는 사전학습 모델 평가에서도 경쟁사를 압도했다. 사전학습 모델은 자체 추가 학습이 가능해서 성능을 끌어올리는데 사용하는 LLM이다. 솔라의 사전학습 모델은 리더보드 평가 기준 66.04점으로 알리바바 '큐원'(65.86점), 메타 '라마2'(50.97점), 미스트랄AI '미스트랄'(60.97점)을 압도했다.

업스테이지는 AWS, Poe, Together.ai 등 글로벌 플랫폼과의 협력을 통해 최고 기술력을 바탕으로 글로벌 생성 AI 시장에 본격적으로 진출할 계획이다. 최근 'AWS 리인벤트 2023' 행사에 참석, AWS의 클라우드 서비스와 AI 플랫폼을 활용해 자체 개발한 LLM을 구축하고 운영하는 과정과 성과에 대해 설명하며 AWS와의 협력을 밝힌 바 있다.

김성훈 업스테이지 대표는 "세계 AI회사들을 압도하는 모델을 공개하게 되어 기쁘고 업스테이지 솔라가 모두를 위한 모델이 되기를 희망한다" 며 "KT의 전략투자를 통한 지원이 큰 도움이 됐고 앞으로 지속적으로 더 큰 격차를 벌릴 수 있는 최고 성능의 솔라 모델을 활용, B2B 시장에서의 협력도 추진할 것"이라고 밝혔다.

류종은 기자 rje312@3protv.com