고난도 문제도 척척… 오픈AI 실험 모델 국제수학올림피아드 금메달 수준 성적

김성민 기자 2025. 7. 21. 00:32
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI의 실험 LLM이 국제수학올림피아드에서 금메달 수준을 달성했다. /알렉산더 웨이 X 캡처

인공지능(AI) 발전 속도가 시간이 갈수록 상상 이상으로 빨라지고 있다. 이번엔 최소 3년 이상 걸릴 것으로 예상했던 고난도 추론을 1년 만에 달성했다.

오픈AI 엔지니어 알렉산더 웨이는 19일(현지 시각) 자신의 X에 “오픈AI의 최신 실험 LLM(대규모 언어 모델)이 AI 분야의 오랜 난제로 여겨졌던 국제수학올림피아드(IMO) 문제 풀이에서 금메달 수준의 성적을 거뒀다”고 밝혔다.

IMO는 1959년 시작된 권위 있는 세계 최대 규모 수학 경시 대회다. 20세 미만 학생들이 참가하는 가장 어려운 대회 중 하나다. 이틀간 치러지며 하루에 3문제씩 총 6문제가 주어지는데, 참가자들은 하루에 4시간 30분씩 이틀간 총 9시간 안에 풀어야 한다. 매우 복잡한 추론과 창의적 사고 과정을 반복하고 이를 논증하고 증명해야 해서 AI가 단기간에 달성하지 못할 것으로 예상됐다.

하지만 오픈AI의 LLM은 인터넷 연결 없이 사람 참가자와 같은 조건에서 문제를 풀었고 전체 6개 중 5개를 맞혀 42점 만점에 35점을 기록했다. 보통 30점 이상이면 상위 12분의 1 안에 들어 금메달을 받는다. 알렉산더 웨이 엔지니어는 “작년 IMO 전용으로 개발한 구글의 AI가 은메달 수준(28점)을 달성한 적이 있다”며 “하지만 오픈AI의 이번 모델은 일반 모델로 더 나은 성적을 냈다”고 했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “우리가 오픈AI를 처음 시작했을 때 이것은 비현실적 목표였다. 이는 지난 10년간 AI가 얼마나 발전했는지 보여주는 중요한 지표”라고 했다.

테크 업계에선 AI의 수학적 추론 능력이 급격히 향상된 것에 주목한다. 작년까지만 해도 초등학교 수학을 이용해 AI를 평가했는데, 고등학교 수준, 수학 경시 대회 수준을 거쳐 1년 만에 올림피아드 수준까지 올랐기 때문이다. 비즈니스인사이더는 “페이팔 창업자인 피터 틸은 작년 인터뷰에서 AI가 이 수준에 달하려면 3~5년이 걸릴 것으로 봤다. 하지만 훨씬 빠르게 달성했다”고 했다.

일각에선 이번 성과를 철저히 검증해야 한다는 의견도 나온다. IMO 본선 문제는 대회 직후에 온라인에 공개됐기 때문에 AI가 이를 미리 학습했을 수도 있다는 것이다.

Copyright © 조선일보. 무단전재 및 재배포 금지.