추론하는 AI모델 나왔다… 수학대회서 정답률 83%

최지원 기자 2024. 9. 14. 01:43
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI가 추론하는 능력을 갖춘 새로운 인공지능(AI) 모델 '오픈AI o1(오원)'을 공개했다.

김명주 서울여대 정보보호학과 교수는 "기존 오픈AI의 챗GPT 모델의 경우 추론이 필요한 질문의 답을 얻으려면 사람이 유도 신문을 하듯 단계별로 적절한 질문을 던져야 했다"며 "o1은 그 작업이 알고리즘에 포함돼 있는 셈"이라고 설명했다.

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 "새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI"라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI, 추론특화 모델 ‘o1’ 출시
알고리즘에 단계적 사고작업 포함
국제 코딩대회서 상위 11% 성과
“인간 수준 범용AI에 근접” 평가
오픈AI가 추론하는 능력을 갖춘 새로운 인공지능(AI) 모델 ‘오픈AI o1(오원)’을 공개했다. 추론 능력이란 각종 정보들을 종합해 스스로 문제를 판단하고 해결하는 것을 뜻한다. o1이 인간 수준의 AI인 범용인공지능(AGI)에 근접했다는 평가가 나온다.

파이낸셜타임스 등에 따르면 오픈AI는 추론에 특화된 o1 모델을 12일(현지 시간) 출시했다. 추론 기능은 단계적으로 사고해야 답을 얻을 수 있는 사고학, 수학, 과학과 같은 분야에서 반드시 필요하다. 김명주 서울여대 정보보호학과 교수는 “기존 오픈AI의 챗GPT 모델의 경우 추론이 필요한 질문의 답을 얻으려면 사람이 유도 신문을 하듯 단계별로 적절한 질문을 던져야 했다”며 “o1은 그 작업이 알고리즘에 포함돼 있는 셈”이라고 설명했다.

오픈AI 블로그에 공개된 내용에 따르면 o1 모델은 국제 수학 올림피아드 예선 시험에서 83%의 정답률을 보였다. 이전 모델인 GPT-4o는 정답률이 13%에 그쳤다. o1은 코딩 실력을 평가하는 국제 코딩 대회에서도 상위 11% 안에 들어가는 성적을 거뒀다. 물리학, 화학 등 과학 분야 질문에 78% 정답률을 보여 박사 과정 학생과 비슷한 수준을 나타냈다.

오픈AI는 o1의 추론 능력을 보여주는 영상도 공개했다. “Strawberry에 몇 개의 ‘r’ 이 있느냐?”는 질문에 “3개”라고 답했다. 기존 AI 모델이 풀지 못한 복잡한 퍼즐도 단계별로 풀어 나갔다. 한국인이 제대로 이해하기 힘든 한국어 문장도 그 의미를 파악해 영어로 번역하기도 했다.

오픈AI 수석 과학자인 야쿠프 파호츠키는 “챗GPT와 같은 이전 모델은 질문을 하면 즉시 응답하기 시작하지만, 이 모델은 시간이 걸릴 수 있다”며 “영어로 문제를 생각하고 분석하고 각도를 찾아 최선의 해답을 제시한다”고 말했다. 오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라고 말했다. 다만 “이 기술도 여전히 결함이 있고, 제한적”이라고 덧붙였다.

실제 o1의 추론 능력이 학계에서 기대하는 수준인지는 지켜봐야 한다는 의견도 나온다. 게리 마커스 뉴욕대 교수는 “과학 커뮤니티의 신중한 검토 끝에 무너지는 추론 기능을 많이 봤다. 나는 새로운 주장에 대해 회의적으로 볼 것”이라고 했다.

오픈AI는 o1 기본 모델과 함께 소형 모델인 ‘o1-mini’도 공개했다. o1에 비해 크기가 작고 빠른 게 특징이다. 챗GPT 플러스, 챗 팀즈 서비스 가입자는 12일부터 바로 o1 서비스를 사용할 수 있다.

최지원 기자 jwchoi@donga.com

Copyright © 동아일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?