오픈AI, 추론 모델 'o3'·'o4'-미니' 공식 출시…"시각 추론 성능 현존 최강"

챗GPT 개발사 오픈AI는 16일(현지시간) 고급 추론 모델 'o3'와 'o4-미니'를 공식 출시한다고 발표했다. 오픈AI는 o3와 o4-미니를 놓고 역대 가장 뛰어난 추론 모델이라고 소개했다.

수학, 코딩, 추론, 과학, 시각적 이해 능력을 측정하는 테스트에서 기존 모델보다 우수한 성능을 발휘했다고 오픈AI는 설명했다. o3는 프롬프트를 받으면 응답을 제공하기 전 잠시 멈추고 관련 프롬프트를 고려해 추론을 설명한다.

이후 가장 정확하다고 판단되는 응답을 요약한다. 오픈AI는 o3가 소프트웨어 개발 역량을 측정하는 테스트인 SWE 벤치 베리파이드(SWE-bench Verified)에서 69.1%의 성공률을 기록했다고 했다.

o4-미니 모델은 68.1%의 성공률을 기록하며 유사한 성능을 보였다. o3-미니의 경우 해당 테스트에서 49.3%를 기록했으며 클로드 3.7 소네트는 62.3%를 기록했다. 'o4-미니'는 개발자들이 애플리케이션 구동 AI 모델을 선택할 때 자주 고려하는 세 가지 요소인 '가격', '성능', '속도' 측면에서 다른 모델보다 경쟁력을 보유하고 있다고 오픈AI 측은 설명했다.

이전 추론 모델과 달리 o3, o4-미니의 경우 웹 브라우징, 파이썬 코드 실행, 이미지 처리, 이미지 생성 등 챗GPT의 도구를 사용해 응답을 생성할 수 있다는 게 특징이다.

특히 오픈AI는 'o3'와 'o4-미니'가 이미지로 사고할 수 있는 최초의 모델이라고 밝혔다. 사용자는 챗GPT에 PDF 다이어그램, 화이트보드 스케치와 같은 이미지를 업로드할 수 있으며, AI 모델은 단순히 이미지를 인식하는 수준을 넘어 시각 정보를 사고 과정에 통합하는 방식을 적용해 응답을 제공한다.

새로운 기능 덕에 'o3'와 'o4-미니'는 흐릿하고 품질이 낮은 이미지도 이해할 수 있다.

또 추론하는 동안 이미지를 확대·축소하거나 회전하는 등의 작업을 수행할 수 있다. 두 모델은 이미지 처리 기능 외에 챗GPT의 캔버스 기능을 통해 브라우저에서 직접 파이썬 코드를 실행하고, 웹을 검색할 수 있다.

새롭게 출시된 모델은 챗 완료 API(Chat Completions API), 리스폰스 API(Responses API)를 통해 제공된다. o3는 입력 토큰 100만개 당 10달러, 출력 토큰은 40달러다. o4-미니의 경우 'o3-미니'와 동일하게 입력 토큰 100만개 당 1.10달러, 출력 토큰은 4.40달러를 부과한다. 오픈AI 앞으로 몇 주 안에 o3-프로를 출시할 계획이라고 밝혔다.

샘 알트만 CEO는 GPT-5 출시에 앞서 'o3'와 'o4-미니'가 챗GPT의 마지막 독립형 AI 추론 모델이 될 수 있다고 밝힌 바 있다.

AI포스트(AIPOST) 진광성 기자

■ 보도자료 및 광고, 비즈니스 협업 문의 aipostkorea@naver.com

AI 컨퍼런스 서울메타위크2025