고난도 문제도 척척… 오픈AI 실험 모델 국제수학올림피아드 금메달 수준 성적

인공지능(AI) 발전 속도가 시간이 갈수록 상상 이상으로 빨라지고 있다. 이번엔 최소 3년 이상 걸릴 것으로 예상했던 고난도 추론을 1년 만에 달성했다.
오픈AI 엔지니어 알렉산더 웨이는 19일(현지 시각) 자신의 X에 “오픈AI의 최신 실험 LLM(대규모 언어 모델)이 AI 분야의 오랜 난제로 여겨졌던 국제수학올림피아드(IMO) 문제 풀이에서 금메달 수준의 성적을 거뒀다”고 밝혔다.
IMO는 1959년 시작된 권위 있는 세계 최대 규모 수학 경시 대회다. 20세 미만 학생들이 참가하는 가장 어려운 대회 중 하나다. 이틀간 치러지며 하루에 3문제씩 총 6문제가 주어지는데, 참가자들은 하루에 4시간 30분씩 이틀간 총 9시간 안에 풀어야 한다. 매우 복잡한 추론과 창의적 사고 과정을 반복하고 이를 논증하고 증명해야 해서 AI가 단기간에 달성하지 못할 것으로 예상됐다.
하지만 오픈AI의 LLM은 인터넷 연결 없이 사람 참가자와 같은 조건에서 문제를 풀었고 전체 6개 중 5개를 맞혀 42점 만점에 35점을 기록했다. 보통 30점 이상이면 상위 12분의 1 안에 들어 금메달을 받는다. 알렉산더 웨이 엔지니어는 “작년 IMO 전용으로 개발한 구글의 AI가 은메달 수준(28점)을 달성한 적이 있다”며 “하지만 오픈AI의 이번 모델은 일반 모델로 더 나은 성적을 냈다”고 했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “우리가 오픈AI를 처음 시작했을 때 이것은 비현실적 목표였다. 이는 지난 10년간 AI가 얼마나 발전했는지 보여주는 중요한 지표”라고 했다.
테크 업계에선 AI의 수학적 추론 능력이 급격히 향상된 것에 주목한다. 작년까지만 해도 초등학교 수학을 이용해 AI를 평가했는데, 고등학교 수준, 수학 경시 대회 수준을 거쳐 1년 만에 올림피아드 수준까지 올랐기 때문이다. 비즈니스인사이더는 “페이팔 창업자인 피터 틸은 작년 인터뷰에서 AI가 이 수준에 달하려면 3~5년이 걸릴 것으로 봤다. 하지만 훨씬 빠르게 달성했다”고 했다.
일각에선 이번 성과를 철저히 검증해야 한다는 의견도 나온다. IMO 본선 문제는 대회 직후에 온라인에 공개됐기 때문에 AI가 이를 미리 학습했을 수도 있다는 것이다.
Copyright © 조선일보. 무단전재 및 재배포 금지.
- 18세 스노보더 유승은, 빅에어 4위로 결선 진출... “3등 안에 들어야죠”
- [속보]日 다카이치의 자민당, 단독 3분의2 확보...전후 최강 정권으로
- [5분 칼럼] 장동혁과 윤석열은 닮은꼴
- 소외된 이웃 없도록... 설 앞두고 서울 자치구 ‘촘촘한 복지’ 총력전
- “면허 반납하면 교통카드 드려요”...용산구 70세 이상 운전자 대상 교통카드 지원
- “한파가 빚은 장관”...서대문구 홍제폭포, 은빛 빙벽으로 변신
- “골목마다 안전하고 청결하게”... 강북구, 빌라관리사무소 신청 모집
- 퇴근 후 책과 여유로운 시간··· 강동구 도서관 운영 시간 확대
- 영등포구, 안양천에 ‘서울 최대’ 36홀 파크골프장 조성
- 한옥에서 만나는 네덜란드 그래픽 아트··· 은평구, 턴체 플뢰르 ‘아이처럼’ 전시 중