[김영욱의 AI 그까이꺼] 수능문제 고민하며 풀이… 더 똑똑해진 `챗GPT o1`

오픈AI, 챗GPT o1 프리뷰·미니 선봬...GPT4o 이후 4개월 만
추론 특화 모델, 텍스트만 인식 가능...웹 브라우징도 불가능
과학·수학·개발 등에 특화...수능 기하와 백터 문제 풀어

카카오의 2023년도 코딩 테스트 문제를 풀라고 지시하고 AI의 생각을 열어봤다. 챗GPT 화면

기하와 백터 문제를 다시 풀게 시켰을 때의 AI의 추론 과정. 챗GPT 화면 캡처

"사람처럼 생각하고 답변하는 인공지능(AI), 수학과 코딩을 더 잘하게 됐다."

오픈AI는 지난 12일(현지시간) 챗GPT o1 프리뷰와 o1 미니 버전을 공개하며, 지난 5월 챗GPT 4o를 선보인 지 4개월 만에 다시 한번 AI 혁신을 선보였다.

이번에 공개된 o1 프리뷰와 o1 미니는 추론에 특화된 AI 모델이다. 추론은 AI가 학습한 정보를 활용해 새로운 결론을 도출하거나 이용자의 질문에 적절하게 대답하는 능력을 의미한다.

앞서 공개된 챗GPT 4o는 텍스트, 오디오, 비디오, 이미지 등 다양한 데이터의 입출력을 처리할 수 있어 범용적으로 사용할 수 있는 AI였다면, 이번 o1 시리즈는 '특화 모델'로 분류할 수 있다. GPT-4o와 달리 이미지와 음성을 인식할 수 없으며, 오로지 텍스트로만 질문을 받는다.

챗GPT를 검색창처럼 활용하는 사용자에게는 o1 시리즈가 큰 도움이 되지 않을 가능성이 있다. GPT-4o는 사용자의 질문이 학습된 데이터에 포함되지 않거나, 사용자가 답변에 대한 출처를 요구할 경우 학습되지 않은 정보도 외부에서 찾아 제공할 수 있었다.

반면, o1 시리즈는 웹 브라우징이 불가능하며 학습된 데이터만을 기반으로 질문에 대답한다. 복잡한 추론과 특수 분야 문제 해결에 특화됐기 때문이다.o1 프리뷰 모델은 프롬프트에 질문을 입력하면 마치 사람처럼 어떻게 분석하고 있는지 조금씩 보여주며 몇 초 동안 '생각'했다고 명시한다. 이 부분을 클릭하면 AI가 어떤 생각을 가지고 질문에 접근하고 분석하며 해결했는지 전 과정을 살펴볼 수 있다. 심지어 한국어 입력이 불완전해도 사용자의 의도를 파악하는 능력을 갖추고 있다.

오픈AI는 이 모델이 과학, 코딩, 수학 등에서 복잡한 문제를 해결하는 데 특히 유용할 것이라고 소개했다. 예를 들어 의학에서는 세포 염기서열 데이터에 주석을 달 수 있고, 물리학자들은 양자 과학에 필요한 복잡한 수학 공식을 생성할 수 있으며, 개발자들은 작업 전반에 활용할 수 있다.

향상된 추론 성능은 수능 수학 문제로 확인할 수 있다. 수능 시험 영어 문제의 경우 GPT-4o와 o1 모두 동일한 대답과 풀이 과정을 제공했으나, 수학에서는 다른 대답과 다른 과정을 제공했다.

기자는 2025년도 고등학교 3학년 9월 모의고사 평가 중 '기하와 벡터'의 30번 문항을 GPT-4o와 o1 모두에게 풀도록 지시했다. 30번 문항은 삼각형의 변 위를 움직이는 점 P와 Q를 주고, PQ의 벡터와 OE의 벡터를 더한 것의 절대값의 제곱값의 최대값과 최소값을 구하는 문제다. GPT-4o는 63, o1은 56을 제출했으나, 정답은 54로 모두 오답이었다. 그러나 o1은 최대값을 맞췄고, 최소값을 틀렸다.

GPT-4o에는 정답을 알려주고 다시 풀도록 지시했으며, o1에는 최소값이 틀렸다고 안내했다. 각 모델은 문제를 다시 풀었는데, GPT-4o는 정답만 맞췄고 최대값과 최소값을 틀렸다. 반면, o1은 모두 맞췄으며, 문제를 푸는 데 79초 동안 '생각'했다고 했다. 이 외에도 국제수학올림피아드 문제도 해결해냈다.

한편, 챗GPT 유료 사용자는 o1 프리뷰 모델로 일주일에 최대 30개의 메시지를, 미니 모델로는 50개의 메시지를 처리할 수 있다. 오픈AI는 사용량 제한을 늘리고 프롬프트에 따라 적절한 모델이 자동 선택되도록 업데이트하겠다고 밝혔다.

김영욱기자 wook95@dt.co.kr

디지털타임스

IT/과학

[김영욱의 AI 그까이꺼] 수능문제 고민하며 풀이… 더 똑똑해진 `챗GPT o1`