업스테이지 개발 생성 AI, 챗GPT 성능 넘었다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
국내 인공지능(AI) 스타트업 업스테이지는 자사가 개발한 생성 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM(거대 언어 모델) 리더보드' 평가 점수에서 72.3점을 획득해 1위를 차지했다고 1일 밝혔다.
허깅페이스 리더보드 기준 생성 AI 모델의 대명사 격인 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[아이뉴스24 박진영 기자] 국내 인공지능(AI) 스타트업 업스테이지는 자사가 개발한 생성 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM(거대 언어 모델) 리더보드' 평가 점수에서 72.3점을 획득해 1위를 차지했다고 1일 밝혔다. 챗GPT 기반인 GPT-3.5 성능을 뛰어넘은 것이다.
허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.
앞서 지난 달 업스테이지가 허깅페이스를 통해 공개한 30B(300억) 매개변수 모델은 평균 67점을 획득, 같은 날 발표된 메타의 '라마(LLaMA) 2' 70B 모델을 추월하고 국내 LLM 최초 1위를 달성하기도 했다.
최근 새롭게 공개된 업스테이지 70B 모델은 리더보드 평가에서 72.3점을 기록, 라마2 발표 이후 순위를 차지한 미국 스테빌리티(Stability) AI의 ‘스테이블 벨루가2’ 모델(71.4점)을 뛰어넘고 세계 1위를 재탈환했다.
업스테이지 최신 모델은 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수를 뛰어넘었다. 허깅페이스 리더보드 기준 생성 AI 모델의 대명사 격인 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초다. 토종 스타트업이 개발한 소형 LLM이 글로벌 빅테크 기업의 초거대 모델과 견주어도 충분한 경쟁력이 있다는 것을 증명했다고 업스테이지 측은 전했다.
향후 업스테이지는 세계적인 경쟁력을 인정받은 자사의 AI 모델 상용화를 통해 본격적인 프라이빗 AI 시장 개척에 나선다. 프라이빗AI는 기업 내부 데이터만 학습해 정보 유출을 막고 잘못된 정보를 생성하는 환각 현상을 방지하는데 특화된 솔루션이다.
/박진영 기자(sunlight@inews24.com)Copyright © 아이뉴스24. 무단전재 및 재배포 금지.
- 옥션, 백화점·홈쇼핑 인기 상품 '극한특가' 진행
- 한진, 드론과 스마트 글라스로 무장한 미래 물류 기술 공개
- [아이포토] 2025학년도 수능 결전의 날, 간절한 기도
- 90명 노쇼에 피해액만 '300만원'…"어떻게 해야 하나" 자영업자의 한숨
- [지스타 2024] 라이온하트, 출품작 4종 트레일러 영상 공개
- [지스타 2024] 하이브IM, 신작 '아키텍트' 인게임 트레일러 공개
- 유철환 권익위원장 "한센인 지킴이‧자립준비청년 등 '약자와 동행' 위해 달린다" [인터뷰]
- 라온시큐어-대한택견회, 블록체인 디지털 단증 발급
- 티맥스소프트, 케이뱅크 IT시스템에 '하이퍼프레임' 제공
- "현장에 즉시 투입"…베스핀글로벌, 디지털 인재 양성 박차