"챗GPT 넘는 수학 특화 언어모델"…업스테이지-콴다-KT 개발
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
130억(13B) 매개변수의 매스GPT는 벤치마크 테스트 평균에서 챗GPT 성능을 넘어섰고, MATH 벤치마크에서는 GPT-4까지 능가했다고 회사는 강조했습니다.
MATH 벤치마크 테스트에서 매스GPT는 1점 만점에 0.488점을 받아 130억 매개변수 이하 모델에서 역대 최고점을 기록했습니다.
GPT-4는 0.425점, 챗GPT는 0.355점, 토라 13B는 0.481점, 토라 7B는 0.401점이었습니다.
GSM8K에서는 매스GPT가 0.782점을 기록해 토라 13B(0.758점)를 제치고 1위를 차지했습니다.
회사는 전략적 파트너십을 통한 KT의 인프라 지원 속에 AI 기반 학습 플랫폼 '콴다' 운영사 매스프레소의 수학 특화 노하우와 고품질의 학습 데이터, 자체 언어 모델 '솔라(SOLAR)'로 세계 1위의 거대언어모델(LLM)을 만든 업스테이지의 모델링 기술력이 합쳐진 결과물이라고 강조했습니다.
업스테이지 김성훈 대표는 "콴다, KT와의 협력을 통해 챗GPT를 뛰어넘고 세계 최고 수준의 수학 특화 언어 모델을 개발하게 되어 뜻깊다"며 "앞으로 글로벌 1위 LLM 기술력을 바탕으로 다양한 영역에서 생성형 AI 혁신을 주도해 나갈 것"이라고 말했습니다.
짧고 유익한 Biz 숏폼 바로가기
저작권자 SBS미디어넷 & SBSi 무단전재-재배포 금지
Copyright © SBS Biz. 무단전재 및 재배포 금지.
- 이자·월세로 2천만원 넘게 버는 직장인, 60만명 넘겼다
- 모두가 부러워하는 고향사랑 1위 여기였네
- 큰 손 30대 '패닉바잉'…'지금 아니면 영원히 내 집 없다'
- 비트코인 현물 ETF 출시, 된다 안된다?…출렁이는 코인시장 [글로벌 뉴스픽]
- '어? 비싼 대출이자 다 똑같네'…알고보니 은행들 짬짜미
- 소상공인 '팬데믹 때 대출 연체기록' 없앤다
- 금융당국 1분기 내 대구은행 시중은행 전환 추진
- 한은 마통으로 버틴 정부, 117조 빌려썼다...이자만 무려
- 4명 중 1명 자영업자 등 비임금근로자…OECD 7위
- 애플, 홍대에 국내 7호 애플스토어 연다…20일 개장