수학대회 정답률 83%…추론하는 AI 모델 나왔다

오픈AI가 추론하는 능력을 갖춘 새로운 인공지능(AI) 모델 ‘오픈AI o1(오원·이하 o1)’을 공개했다. 추론 능력이란 각종 정보들을 종합해 스스로 문제를 판단하고 해결하는 것을 뜻한다. o1이 인간 수준의 AI인 범용인공지능(AGI)에 근접했다는 평가가 나온다.

파이낸셜타임스 등에 따르면 오픈AI는 추론에 특화된 o1 모델을 12일(현지시간) 출시했다. 추론 기능은 단계적으로 사고해야 답을 얻을 수 있는 사고학, 수학, 과학과 같은 분야에서 반드시 필요하다.김명주 서울여대 정보보호학과 교수는 “기존 오픈AI의 챗GPT 모델의 경우 추론이 필요한 질문의 답을 얻으려면 사람이 유도 심문을 하듯 단계 별로 적절한 질문을 던져야 했다”며 “o1은 그 작업이 알고리즘에 포함돼 있는 셈”이라고 설명했다.

오픈AI 블로그에 공개된 내용에 따르면 o1 모델은 국제 수학 올림피아드 예선 시험에서 83%의 정답률을 보였다. 이전 모델인 GPT-4o는 13% 정답률에 그쳤다. 코딩 실력을 평가하는 국제 코딩 대회에서도 상위 11% 안에 들어가는 성적을 거뒀다. 물리학, 화학 등 과학 분야 질문에 78% 정답률을 보여 박사 과정 학생과 비슷한 수준을 나타냈다.

오픈AI는 o1의 추론 능력을 보여주는 영상도 공개했다. “Strawberry에 몇 개의 ‘r’ 이 있느냐?”는 질문에 “3개”라고 답했다. 기존 AI 모델이 풀지 못한 복잡한 퍼즐도 단계별로 풀어나갔다. 한국인이 제대로 이해하지 힘든 한국어 문장도 그 의미를 파악해 영어로 번역하기도 했다.

오픈AI 수석 과학자인 야쿱 파초키는 “챗GPT와 같은 이전 모델은 질문을 하면 즉시 응답하기 시작하지만, 이 모델은 시간이 걸릴 수 있다”며 “영어로 문제를 생각하고 분석하고 각도를 찾아 최선의 해답을 제시한다”고 말했다. 오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라고 말했다. 다만 “이 기술이 여전히 결함이 있고, 제한적”이라고 덧붙였다.

실제 o1의 추론 능력이 학계에서 기대하는 수준인지는 지켜봐야 한다는 의견도 나온다. 게리 마커스 뉴욕대 교수는 “과학 커뮤니티의 신중한 검토 끝에 무너지는 추론 기능을 많이 봤다. 나는 새로운 주장에 대해 회의적으로 볼 것”이라고 했다.

오픈AI는 o1 기본 모델과 함께 소형 모델인 ‘o1-mini’도 공개했다. o1에 비해 크기가 작고 빠른 게 특징이다. 추론이 필요하지만 광범위한 지식을 필요하지 않은 경우 효율적이라고 오픈AI는 소개했다. 챗GPT 플러스, 챗 팀즈 서비스 가입자는 12일부터 바로 o1 서비스를 사용할 수 있다.

최지원 기자 jwchoi@donga.com

동아일보

속보

수학대회 정답률 83%…추론하는 AI 모델 나왔다