오픈AI·MS 제치고 수학능력평가 1위 오른 K-스타트업, 어디?

김태현 기자 2024. 1. 8. 14:00
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

챗GPT는 전문 지식과 같은 학습 데이터가 아닌 대규모 텍스트 데이터를 기반으로 학습돼 틀린 정보를 진짜처럼 답하는 환각 현상을 보인다.

KT의 강력한 인프라와 기반 모델 분야에서 축적된 노하우, 콴다의 독보적인 수학 특화 데이터, 그리고 업스테이지의 뛰어난 모델링 기술력이 결합돼 이런 결과를 만들어 낸 것이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

매스프레소 '매스GPT', 수학능력평가서 1위 차지

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

/사진제공=메스프레소

인공지능(AI) 기반 학습 플랫폼 '콴다'를 운영하는 매스프레소(이하 콴다)는 AI 스타트업 업스테이지, KT와 공동 개발한 수학 도메인 특화 프라이빗(Private) 거대언어모델(LLM)이 오픈AI와 마이크로소프트(MS) 모델을 제치고 세계 신기록을 달성했다고 8일 밝혔다.

챗GPT는 전문 지식과 같은 학습 데이터가 아닌 대규모 텍스트 데이터를 기반으로 학습돼 틀린 정보를 진짜처럼 답하는 환각 현상을 보인다. 따라서 정확한 정보 제공이 핵심인 교육 분야에서 치명적인 문제로 손꼽힌다. 특히 수학 부문에서 낮은 정확도를 보인다.

콴다와 업스테이지는 지난해 11월 KT와의 전략적 파트너쉽의 일환으로 '매스GPT(MathGPT)' 개발에 착수했다. 콴다는 매일 1000만건의 문제 검색을 통해 축적된 학습 수준, 맥락, 상호작용 등 학습 데이터를 업스테이지에 제공했다. 업스테이지는 이를 환각현상 방지에 특화된 자체 솔루션에 학습시켜 자연어 기반 언어모델이 논리적 추론이 가능하도록 파인튜닝했다.

매스GPT는 'MATH'(1만2500개의 고난도 수학 경시 문제), 'GSM8K'(8500개의 초등학교 수학 문제) 등 수학 능력을 평가하는 벤치마크에서 기존 최고 기록인 MS의 'ToRA 13B'를 제치고 1위를 차지했다. MATH 벤치마크에서는 오픈AI의 GPT-4의 성능을 넘어섰다.

이러한 성과 배경에는 콴다, 업스테이지, KT 3사의 협력이 있다. KT의 강력한 인프라와 기반 모델 분야에서 축적된 노하우, 콴다의 독보적인 수학 특화 데이터, 그리고 업스테이지의 뛰어난 모델링 기술력이 결합돼 이런 결과를 만들어 낸 것이다.

콴다 측은 "매스GPT의 정확도와 성능을 지속해서 향상하고, 궁극적으로는 이를 자사의 학습 인터페이스와 결합해 AI 보조 교사인 'AI 튜터'로 구현하겠다"며 "향후 AI 튜터 서비스를 모든 교육 현장과 솔루션에 접목해 글로벌 AI 튜터로써 교육 시장을 혁신하겠다"고 밝혔다.

업스테이지 김성훈 대표는 "콴다, KT와의 협력을 통해 챗GPT를 뛰어넘고 세계 최고 수준의 수학 특화 언어모델을 개발하게 되어 뜻깊다"라며 "앞으로 업스테이지는 글로벌 1위 LLM 기술력을 바탕으로 다양한 영역에서 생성형 AI 혁신을 주도해 나갈 것"이라고 밝혔다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

김태현 기자 thkim124@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?