흐릿한 그림도 이해... 오픈AI, '이미지로 사고하는' 새 추론 모델 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
챗GPT 개발사 오픈AI가 스케치나 도표, 포스터 등을 인식하고 분석할 수 있는 추론 특화 인공지능(AI) 모델을 공개했다.
단순히 이미지를 보기만 하는 게 아니라 시각 정보를 이해하고 사고 과정에 통합할 수 있는 첫 모델이라고 오픈AI는 설명했다.
오픈AI는 "o3는 자사의 가장 정교한 추론 모델"이라며 "수학·코딩·추론·과학 등 이해 능력을 측정하는 테스트에서 이전 모델들을 능가했다"고 소개했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
도표·포스터·흐릿한 이미지도 이해

챗GPT 개발사 오픈AI가 스케치나 도표, 포스터 등을 인식하고 분석할 수 있는 추론 특화 인공지능(AI) 모델을 공개했다. 단순히 이미지를 보기만 하는 게 아니라 시각 정보를 이해하고 사고 과정에 통합할 수 있는 첫 모델이라고 오픈AI는 설명했다.
오픈AI는 이미지 인식 능력이 생긴 주력 추론 특화 AI 모델 'o3'와 경량화 모델 'o4 미니'를 출시한다고 이날 밝혔다. o3는 오픈AI가 지난해 처음 공개한 추론 모델 o1의 후속 제품이다. 앞서 오픈AI는 o3 시리즈 중 가장 가벼운 버전인 'o3 미니'를 지난 1월 먼저 출시했다.
추론 특화 모델은 학습하지 않은 문제가 주어지더라도 이미 알고 있는 것에 기반해 스스로 답을 찾아 나가는 모델이다. 자신이 낸 답이 맞는지 직접 검증하고 틀렸을 경우에는 다시 정답을 찾는 과정을 거친다. 이 때문에 수학, 과학, 컴퓨터 프로그래밍처럼 단계별 논리적 사고가 필요한 영역에서 특히 강점을 보인다.
오픈AI는 "o3는 자사의 가장 정교한 추론 모델"이라며 "수학·코딩·추론·과학 등 이해 능력을 측정하는 테스트에서 이전 모델들을 능가했다"고 소개했다. 특히 이번에 공개한 모델들은 이미지를 보고 사고할 수도 있다고 회사는 설명했다. 직접 이미지를 확대하거나 회전시키면서 분석하기 때문에 화질이 낮거나 흐릿한 이미지도 이해할 수 있다고 한다.
챗GPT 유료 이용자들은 이날부터 이들 모델을 이용할 수 있다. 오픈AI는 두 모델을 마지막으로 앞으로는 추론형 모델을 따로 출시하지 않을 수도 있음을 시사했다. 샘 올트먼 오픈AI 최고경영자는 "o3와 o4 미니는 GPT-5 출시 전까지 마지막 독립형 AI 추론 모델이 될 수 있다"고 말했다. GPT-5부터는 추론 모델과 비추론 모델이 통합될 가능성이 크다고 시사한 것이다.
실리콘밸리= 이서희 특파원 shlee@hankookilbo.com
Copyright © 한국일보. 무단전재 및 재배포 금지.
- [단독] 수십 통 전화벨에 여론조사 포비아...작년에만 2700만대 울렸다 | 한국일보
- "가장 폭력적인 정치인은 누구?" 선거법 구멍에 '편향 설문' 판친다 | 한국일보
- "입에서 입 '러브샷' 시켰다"... 조선대 신입생 MT 성희롱 논란 | 한국일보
- 유영재, 선우은숙 친언니 강제추행 혐의 인정 "깊이 사과" | 한국일보
- 데뷔 30년 만에 첫 악역 박은빈 "거친 느낌 내려 드라이도 안 해" | 한국일보
- 이국종에 맞장구친 안철수... "문과X들 해 먹는 나라, 이과생이 끝내겠다" | 한국일보
- 문재인은 뚫었다… 이재명 지지율 정말 30%대 '박스권'에 갇혔나 | 한국일보
- 일격 맞은 '한덕수 차출론'... 단일화 외쳤던 김문수 '머쓱' | 한국일보
- 김대호, 전현무와 대치 "어차피 프리랜서는 밥그릇 싸움" | 한국일보
- 20세 최연소 사시 합격자, 김앤장 퇴사 후 대학원 진학한 이유는? | 한국일보