오픈AI, GPT-5.5 출시…“자율성·직관성 높여”
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈AI가 두 달 만에 새 인공지능(AI) 모델을 선보이며 앤트로픽의 주도권 경쟁에 불을 지폈습니다.
오픈AI는 현지 시각 23일 새 AI 모델 'GPT-5.5'를 공개하면서 "현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델"이라고 소개했습니다.
오픈AI가 공개한 성능지표 보고서를 보면 GPT-5.5는 상당수 영역에서 앤트로픽의 주력 모델인 '클로드 오퍼스4.7'보다 높은 점수를 받았습니다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI가 두 달 만에 새 인공지능(AI) 모델을 선보이며 앤트로픽의 주도권 경쟁에 불을 지폈습니다.
오픈AI는 현지 시각 23일 새 AI 모델 'GPT-5.5'를 공개하면서 "현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델"이라고 소개했습니다.
오픈AI가 공개한 성능지표 보고서를 보면 GPT-5.5는 상당수 영역에서 앤트로픽의 주력 모델인 '클로드 오퍼스4.7'보다 높은 점수를 받았습니다.
지식 업무 수행 능력을 평가하는 'GDPval' 지표는 84.9%를 받아 80.3%에 머무른 오퍼스4.7을 능가했습니다.
터미널 환경 작업 능력인 '터미널-벤치 2.0'에서는 82.7%를 기록해 오퍼스4.7(69.4%)을 10%p 이상 앞섰고, 사이버 보안 능력을 평가하는 '사이버짐'에서도 81.8%로 오퍼스4.7의 73.1%를 뛰어넘었습니다.
다만 코딩 부문 지표인 'SWE-벤치 프로'에서는 58.6%에 그쳐, 오퍼스4.7이 64.3%라는 점을 고려하면 5%p 이상 격차가 납니다.
오픈AI는 "앤트로픽의 모델은 데이터 암기 징후가 보고됐다"며 평가 결과를 인정할 수 없다는 반응을 보였습니다.
오픈AI는 이전에도 앤트로픽의 AI 모델이 80% 이상의 점수를 받는 'SWE-벤치 베리파이드' 지표의 평가 데이터가 오염됐다며 해당 지표를 더 이상 쓰지 않겠다고 밝힌 바 있습니다.
오픈AI 측은 이날 화상 브리핑에서 앤트로픽의 '미토스'의 성능을 비교하는 질문에 "모델이 매우 정확하다"며 성능지표를 확인해 보라고 답했습니다.
오픈AI는 특히 GPT-5.5가 에이전트형 연산에 더 적합하도록 자율성과 직관성을 높였다고 강조했습니다.
그레그 브록먼 오픈AI 사장은 "이 모델이 정말 특별한 점은 더 적은 지침으로도 더 많은 일을 할 수 있다는 것"이라며 "불분명한 문제를 보고 다음에 무엇을 해야 하는지 스스로 파악해 낸다"고 설명했습니다.
오픈AI는 GPT-5.5가 전작인 GPT-5.4보다 더 높은 성능을 보이면서도 토큰당 대기시간은 동일하게 유지했다는 점을 내세우면서 "더 이상 성능을 위해 속도를 희생할 필요가 없다"고 말했습니다.
■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 유튜브, 네이버에서도 KBS뉴스를 구독해주세요!
이화연 기자 (yeon@kbs.co.kr)
Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지