업스테이지, '허깅페이스 오픈 LLM 리더보드'서 챗GPT 추월
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 스타트업 업스테이지가 개발한 생성 AI 모델이 세계 최고 대규모 언어모델(LLM) 자리를 유지했다.
업스테이지는 자사의 개발한 생성 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM 리더보드' 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 1위를 차지했다고 1일 밝혔다.
허깅페이스 리더보드 기준 생성 AI 모델의 대명사 격인 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
LLM 기반 프라이빗 AI 시장 공략 가속화
"보안 걱정없는 기업용 GPT 선보일 것"
[더팩트|최문정 기자] 인공지능(AI) 스타트업 업스테이지가 개발한 생성 AI 모델이 세계 최고 대규모 언어모델(LLM) 자리를 유지했다.
업스테이지는 자사의 개발한 생성 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM 리더보드' 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 1위를 차지했다고 1일 밝혔다.
허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여 개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력과 환각현상(할루시네이션) 방지 등 4가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.
앞서 지난달 업스테이지가 허깅페이스를 통해 공개한 300억 매개변수 모델은 평균 67점을 획득해 같은 날 발표된 메타의 '라마(LLaMA) 2' 700억 모델을 추월하고 국내 LLM 최초 1위 달성이라는 쾌거를 올렸다.
업스테이지는 더 많은 데이터로 최신 라마 2 700억 매개변수 기반으로 파인튜닝한 모델을 내놓으며 글로벌 1위 굳히기에 나섰다. 새롭게 공개된 업스테이지 70B 모델은 리더보드 평가에서 72.3점을 기록해 라마2 발표 이후 순위를 차지한 미국 스테빌리티 AI의 '스테이블 벨루가2' 모델(71.4점)을 뛰어넘고 세계 1위를 재탈환했다.
업스테이지의 최신 모델은 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수도 넘겼다. 허깅페이스 리더보드 기준 생성 AI 모델의 대명사 격인 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초다. 이를 통해 토종 스타트업이 개발한 소형 LLM이 글로벌 빅테크 기업의 초거대 모델과 견주어도 충분한 경쟁력이 있다는 것을 증명했다.
앞으로 업스테이지는 자체 AI 모델 상용화를 통해 본격적인 '프라이빗AI' 시장 개척에 나선다. 프라이빗AI는 기업 내부 데이터만 학습해 정보 유출을 막고 잘못된 정보를 생성하는 환각 현상을 방지하는 데 특화된 솔루션이다. 특히 보안 이슈 등으로 생성 AI 도입을 주저하는 기업들에게 매력적인 대체재로 각광받고 있다.
또한 업스테이지는 최소 수천억이 넘는 매개변수로 구성된 빅테크 기업의 거대 LLM보다 경량화된 모델 사이즈로 더욱 뛰어난 성능을 제공하는 한편, 도입과 운용 비용도 절감에도 나설 예정이다.
김성훈 업스테이지 대표는 "업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인하게 돼 기쁘다"며 "앞으로 업스테이지는 압도적인 기술력을 바탕으로 국내외 프라이빗AI 시장 지배력 강화에 박차를 가하겠다"고 밝혔다.
munn09@tf.co.kr
발로 뛰는 더팩트는 24시간 여러분의 제보를 기다립니다.
▶카카오톡: '더팩트제보' 검색
▶이메일: jebo@tf.co.kr
▶뉴스 홈페이지: http://talk.tf.co.kr/bbs/report/write
Copyright © 더팩트. 무단전재 및 재배포 금지.
- '찍어내기 논란' 총경 인사 여진…흔들리는 경찰청장 리더십
- '명낙' 만났지만 곳곳 뇌관…민주당, 계파 갈등 봉합 요원
- HDC현산, 실적부진·안전사고로 시평 '휘청'…평가액 1조 원 증발
- '처가 리스크' 부담? '특별감찰관제' 공 넘긴 대통령실
- 파행 거듭 과방위...'이동관 청문회' 등 8월도 산 넘어 산
- 너도나도 엔화 샀는데 긴축 신호탄 쏜 일본…엔화 전망은?
- "실물카드만 됩니다"…'1살' 모바일 면허증 갈길 머네
- [오늘의 날씨] 최고 36도 '가마솥더위'…"야외활동 자제해야"
- '아이언맨'보다 재밌는 하정우의 '비공식작전'[TF인터뷰]
- 'K-떼창' 준비완료…하반기 팝스타 내한 러시[TF프리즘]