업스테이지 "거대언어모델, GPT-3.5 성능 뛰어넘어"
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 스타트업 '업스테이지'는 자사의 거대 언어모델(LLM)이 오픈AI의 GPT-3.5 성능을 뛰어넘는 성과를 거뒀다고 1일 밝혔다.
업스테이지의 언어모델은 머신러닝 플랫폼 '허깅페이스'에서 운영하는 오픈 LLM 리더보드에서 72.3점으로 1위를 차지했다.
앞서 업스테이지는 지난달에도 매개변수 300억 개를 가진 자체 모델이 허깅페이스 리더보드에서 평균 67점을 얻어, 같은 날 발표된 메타의 '라마-2'를 넘어 국내 거대언어모델 처음으로 1위를 기록했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
메타 '라마-2' 파인튜닝
인공지능(AI) 스타트업 '업스테이지'는 자사의 거대 언어모델(LLM)이 오픈AI의 GPT-3.5 성능을 뛰어넘는 성과를 거뒀다고 1일 밝혔다.
업스테이지의 언어모델은 머신러닝 플랫폼 '허깅페이스'에서 운영하는 오픈 LLM 리더보드에서 72.3점으로 1위를 차지했다. 허깅페이스 오픈 거대언어모델 리더보드는 매개변수 1천억개 이하인 거대언어모델들의 추론, 상식 능력, 언어이해 종합능력, 환각 현상(할루시네이션) 방지 등 네 가지 지표를 평가한 뒤 점수를 평균 내 순위를 결정한다.
업스테이지에 따르면 이 모델은 미국 스태빌리티AI '스테이블 벨루가2'(71.4점)를 제친 것은 물론, 허깅페이스 리더보드에서 GPT-3.5 벤치마크 점수(71.9점)를 넘긴 첫 사례다. 앞서 업스테이지는 지난달에도 매개변수 300억 개를 가진 자체 모델이 허깅페이스 리더보드에서 평균 67점을 얻어, 같은 날 발표된 메타의 '라마-2'를 넘어 국내 거대언어모델 처음으로 1위를 기록했다.
업스테이지가 개발한 언어모델은 매개변수(패러미터)가 700억 개 수준인 메타 '라마-2'를 파인튜닝(미세조정)했다.
김성훈 업스테이지 대표는 "압도적인 기술력을 바탕으로 (기업 내부 서버에 설치·운영할 수 있고 정보 유출을 막을 수 있는) '프라이빗 AI' 시장 지배력 강화에 박차를 가하겠다"고 말했다.
Copyright © 서울경제. 무단전재 및 재배포 금지.
- 앞서가는 택시 '급 브레이크'…알고보니 운전 중 '성인물' 검색했다
- '월375만원에 노동착취' VS '그만두고 내가 하고 싶다'…'탕후루' 가게 채용글에 MZ 갑론을박
- 청계천 물고기 '집단폐사', 사체 수거 중…무슨 일?
- '대학생 때 4년 연애' 아내 과거에…'남편이 산부인과 기록 떼오라네요'
- '건강했는데'…매일 소주 1~2잔 마시면 '이렇게' 됩니다
- 혼자 넘어진 할머니 부축해 드렸더니…'네 차 때문' 따지고 고함
- '파도풀 타는데 중요 부위에 손이…여자 혼자라 건드린 듯'
- 샤넬도 이제 오픈런 안하는데…성심당 인기 어느 정도기에 경찰까지
- 유튜브 댓글창 다시 연 주호민… 추가 입장 밝히나
- '시진핑 실세 외교부장관' 친강과 불륜설' 홍콩 기자, 아들 사진 올리고 '아빠는…' 무슨일?