AI기업 업스테이지, 소형언어모델 최강자 ‘솔라 프로’ 프리뷰 버전 공개

김주완 2024. 9. 11. 11:43
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 스타트업 업스테이지가 차세대 LLM '솔라 프로(Solar Pro)'의 초기 테스트용 모델인 '솔라 프로 프리뷰' 버전을 오픈소스 및 무료 API를 통해 전면 공개한다고 11일 밝혔다.

업스테이지의 김성훈 대표는 "자체 기술로 개발한 세계 최고 수준의 LLM 솔라를 통해 글로벌 AI 시장에 도전장을 내민 업스테이지가 더욱 강력한 차기 모델을 야심 차게 준비하고 있다"라며 "최소의 인프라 비용으로 업계 최강의 성능을 자랑하는 솔라 프로를 프리뷰 버전을 통해 많이 테스트해 보기를 바란다"라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인공지능(AI) 스타트업 업스테이지가 차세대 LLM ‘솔라 프로(Solar Pro)’의 초기 테스트용 모델인 ‘솔라 프로 프리뷰’ 버전을 오픈소스 및 무료 API를 통해 전면 공개한다고 11일 밝혔다. 

솔라 프로는 솔라 LLM 시리즈의 상위 모델이다. 올 11월 공식 출시를 앞두고 있다. 업스테이지는 현재 개발 중인 모델을 미리 테스트해 볼 수 있는 프리뷰 버전을 오픈소스로 공개하는 한편, API 호출 비용까지 무상 지원할 예정이다. 프리뷰 버전은 영어만 지원하며, 입력 토큰 수도 4096자로 제한된다.

솔라 프로는 220억(22B) 매개변수를 갖춰 기존 ‘솔라 미니’(107억) 대비 두 배 이상 커지고 성능도 대폭 향상됐다. DUS(깊이 확장 스케일) 기술 등 자체 LLM 모델링 방법론을 더욱 고도화한 결과 여전히 단 1개의 GPU에서 구동이 가능한 수준으로 경량화에 성공했다. 업스테이지 관계자는 "최근 GPU 가격 급등과 수급난으로 골머리를 앓는 기업용 AI 시장의 판도를 크게 바꿀 것으로 기대를 모은다"고 말했다,. 

솔라 프로는 인문학 뿐만 아니라 과학·기술·공학·수학(STEM) 종합 지식을 평가하는 ‘MMLU Pro’, 지시 이행 능력을 평가하는 ‘IFEval’ 등 최신 LLM 벤치마크(성능 평가) 지표에서 솔라 미니보다 평균 51% 이상 대폭 향상됐다. 최신 지표인 MMLU Pro는 LLM 답변의 정확도를 사지선다로 평가하던 기존 방식에서 선택지를 10개까지 늘려 정답률을 낮추고, 학부생 수준 이상의 추론을 요구해 고난도로 정평이 높다.

이런 성능은 마이크로소프트(MS)의 ‘파이(Phi)-3 미디엄(Medium)’, 메타 ‘라마(Llama) 3.1 8B’, 미스트랄AI-엔비디아 ‘네모(NeMo) 12B’, 구글 ‘젬마(Gemma) 2 27B’ 등 비슷한 사이즈의 빅테크 모델 성능을 모두 뛰어넘은 수치라고 업스테이지는 설명했다. 업스테이지 관계자는 "매개변수가 3배 이상 큰 ‘라마 3.1 70B’ 등 다중 GPU를 요구하는 모델과 유사한 수준이다. 이로써 업스테이지는 자체 기술력으로 소형언어모델(sLLM) 영역에서 또 한 번 독보적인 격차를 만든 것"이라고 설명했다. 

업스테이지의 김성훈 대표는 “자체 기술로 개발한 세계 최고 수준의 LLM 솔라를 통해 글로벌 AI 시장에 도전장을 내민 업스테이지가 더욱 강력한 차기 모델을 야심 차게 준비하고 있다”라며 “최소의 인프라 비용으로 업계 최강의 성능을 자랑하는 솔라 프로를 프리뷰 버전을 통해 많이 테스트해 보기를 바란다”라고 밝혔다.

김주완 기자 kjwan@hankyung.com

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?