업스테이지·콴다·KT “챗GPT 능가하는 수학 특화 언어모델 개발”
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
업스테이지는 인공지능(AI) 기반 학습 플랫폼 '콴다'를 운영하는 매스프레소 및 KT와 공동 개발한 수학 도메인 특화 'MathGPT(가칭)'가 오픈AI의 챗GPT와 마이크로소프트(MS) 모델을 제치고 세계 신기록을 달성했다고 8일 밝혔다.
전략적 파트너십을 통한 KT의 전폭적인 인프라 지원에 힘입어, 콴다의 독보적인 수학 특화 노하우와 고품질의 학습 데이터, 그리고 자체 언어 모델 '솔라'(SOLAR) 등을 만든 업스테이지의 모델링 기술력이 합쳐져 최고의 결과물을 만들어냈다는 것이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
수학 도메인 특화 매스GPT 개발
앞서 업스테이지와 콴다는 지난해 11월 KT와 전략적 파트너십의 일환으로 MathGPT 개발에 착수한 바 있다. 업스테이지는 콴다의 고품질 수학 전문 데이터를 학습해, 자연어 기반 언어 모델이 논리적 추론과 프로그래밍화를 통해 복잡한 수학 문제를 풀 수 있도록 파인튜닝을 진행했다.
이에 양사는 130억개(13B) 매개변수를 가진 매스GPT를 개발, ‘MATH’, ‘GSM8K’ 등 언어 모델의 수학 능력을 평가하는 대표 벤치마크 테스트에서 동급 최강의 MS ‘ToRA 13B’를 능가하는 고무적인 성적표를 거뒀다고 전했다. 이는 13B 이하 모델 1위에 해당하는 신기록이라는 게 회사 측 설명이다.
업스테이지 관계자는 “1만2500개의 고난도 수학 경시 문제로 구성된 MATH 벤치마크와 8500개의 초등학교 수학 문제로 산술 연산을 테스트하는 GSM8K 벤치마크 등 두 가지 척도에서 동시에 최고 성능을 달성한 경우는 최근 세계적으로도 유례를 찾아볼 수 없는 성과”라고 자평했다.
특히 매스GPT는 벤치마크 테스트 평균에서 챗GPT 성능을 돌파하고, MATH 벤치마크에서는 GPT-4까지 능가했다는 후문이다.
이러한 성과에는 업스테이지, 콴다, KT 3사의 유기적인 협력이 주효했다.
전략적 파트너십을 통한 KT의 전폭적인 인프라 지원에 힘입어, 콴다의 독보적인 수학 특화 노하우와 고품질의 학습 데이터, 그리고 자체 언어 모델 ‘솔라’(SOLAR) 등을 만든 업스테이지의 모델링 기술력이 합쳐져 최고의 결과물을 만들어냈다는 것이다.
한편 업스테이지는 앞으로 솔라를 앞세워 교육 뿐 아니라 금융, 유통, 의료, 엔터테인먼트 등 다양한 산업군에서 생성형 AI 기술을 적극 적용한다는 계획이다.
김성훈 업스테이지대표는 “다양한 영역에서 생성형 AI 혁신을 주도해 나갈 것”이라고 전했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “전기차 산 내가 바보였네”…충전요금 인상카드 만지작 거리는 한전 - 매일경제
- “버리면 쓰레기인데, 돈 벌고 기부도”…주민 1만명 넘게 나선 ‘쓰테크’ - 매일경제
- [단독] 태영, 당국·채권자 요구안 수용…워크아웃 개시될듯 - 매일경제
- “부자 동네는 이렇구나”…의사 2배 많고 특목고 진학 3배 높아 - 매일경제
- 225만원 개집·34만원 개밥그릇 ‘펫셔리’…댕댕아, 네가 나보다 잘산다 - 매일경제
- 잘나가는 스타트업, 알고보니 고딩사장…미국 IT성지에서도 주목 - 매일경제
- “저학력 남성은 결혼 힘들대”…독신남 늘면 노동시장 충격 ‘어마어마’ - 매일경제
- “서울에 내집, 이젠 포기해야 ㅠㅠ”…아파트 평당 분양가 3400만원 돌파 - 매일경제
- “벌써 50% 손실날 판, 억장 무너져”…손실 시작된 19조원 ‘이것’ 뭐길래 - 매일경제
- 미국농구 유명 전문가 “여준석 계속 발전할 재능” - MK스포츠