업스테이지 "자체 개발 AI, 챗GPT 성능 뛰어넘었다"

최유리 2023. 8. 1. 13:51
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다.

지난달 업스테이지가 허깅페이스를 통해 공개한 300억 매개변수 모델은 평균 67점을 획득했다.

김성훈 업스테이지 대표는 "업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인해 기쁘다"며 "앞으로 업스테이지는 압도적인 기술력을 바탕으로 국내외 프라이빗 AI 시장 지배력 강화에 박차를 가할 것"이라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

허깅페이스 평가 점수서 GPT-3.5 뛰어넘어

업스테이지는 자사가 개발한 생성 인공지능(AI) 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 거대 언어모델(LLM) 리더보드 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 1위를 차지했다고 1일 밝혔다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4가지 지표의 평균 점수로 경쟁해 순위가 매겨진다.

[사진출처=업스테이지]

지난달 업스테이지가 허깅페이스를 통해 공개한 300억 매개변수 모델은 평균 67점을 획득했다. 같은 날 발표된 메타의 '라마(LLaMA) 2' 700억 매개변수 모델을 추월하고 국내 LLM 첫 1위를 달성했다. 이에 업스테이지는 더 많은 데이터로 최신 라마 2를 파인튜닝한 모델을 내놨다. 그 결과 업스테이지 70B 모델은 리더보드 평가에서 72.3점을 기록했다. 이는 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수를 넘긴 것이다.

김성훈 업스테이지 대표는 "업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인해 기쁘다"며 "앞으로 업스테이지는 압도적인 기술력을 바탕으로 국내외 프라이빗 AI 시장 지배력 강화에 박차를 가할 것"이라고 말했다.

최유리 기자 yrchoi@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?