오픈AI, 새 AI모델 GPT-5.4 공개…추론·코딩 모델 통합
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
챗GPT 개발사 오픈AI가 추론이 필요한 지식 업무와 코딩 기능을 통합한 새 AI 모델을 공개했다.
오픈AI는 최상위 AI 모델의 개선판인 'GPT-5.4'와 'GPT-5.4 프로'를 5일(현지시간) 선보였다.
이날 공개된 GPT-5.4 모델은 챗GPT 유로 가입자들에게 즉시 제공되며, 기존 모델인 'GPT-5.2 사고' 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
![오픈AI [로이터=연합뉴스 자료사진. 재판매 및 DB 금지]](https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/06/yonhap/20260306052726324umar.jpg)
(샌프란시스코=연합뉴스) 권영전 특파원 = 챗GPT 개발사 오픈AI가 추론이 필요한 지식 업무와 코딩 기능을 통합한 새 AI 모델을 공개했다.
오픈AI는 최상위 AI 모델의 개선판인 'GPT-5.4'와 'GPT-5.4 프로'를 5일(현지시간) 선보였다.
이 모델은 이전에 영역별로 'GPT-5.2 사고(Thinking)'와 'GPT-5.3-코덱스' 등으로 나뉘어 있던 모델을 하나로 통합한 것이 특징이다.
또 이용자의 컴퓨터를 직접 조작해 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있는 '컴퓨터 제어' 에이전트 기능도 자사 범용 모델 가운데 처음으로 탑재했다.
한 번에 처리할 수 있는 데이터양도 최대 100만 토큰(AI 모델의 입출력 단위)으로 늘려 AI 에이전트가 긴 안목의 계획을 수립하고 실행할 수 있도록 했다.
GPT-5.4 프로 모델은 44개 직종의 지식 업무 수행 능력을 평가하는 "GDPval' 성능지표(벤치마크)에서 82%를 기록해 70% 수준이었던 전작을 뛰어넘었다.
또 정보검색 능력을 측정하는 '브라우즈컴프' 지표에서도 89.3%로 경쟁작인 구글 제미나이3.1 프로(85.9%)나 앤트로픽 클로드 오퍼스 4.6(84%)보다 점수가 높았다.
코딩 능력을 재는 'SWE-벤치 프로 퍼블릭' 지표에서는 GPT-5.4가 57.7%를 받았는데, 이는 제미나이3.1 프로(54.2%)를 상회하는 점수다.
다만 오픈AI는 지금껏 코딩 능력 평가 기준으로 삼아왔던 'SWE-벤치 베리파이드' 지표는 공개하지 않았다. 오픈AI는 이 지표가 AI 훈련 데이터 등에 노출돼 결과가 오염됐기 때문이라고 설명했다.
'SWE-벤치 베리파이드'에서는 지금까지 클로드 오퍼스 4.6이 가장 높은 점수를 유지해오고 있었다.
이날 공개된 GPT-5.4 모델은 챗GPT 유로 가입자들에게 즉시 제공되며, 기존 모델인 'GPT-5.2 사고' 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.
comma@yna.co.kr
▶제보는 카톡 okjebo
Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지
- '트럼프 전 며느리' 버네사, 연인 우즈에 "사랑해"…공개 응원 | 연합뉴스
- [샷!] "여친과 색다른 경험 해보고 싶어 방문" | 연합뉴스
- 오상진·김소영 부부, 3일 둘째 득남…"산모·아이 건강" | 연합뉴스
- 런던시장 집앞 길거리서 총기 무더기 발견…"경찰 실수인 듯" | 연합뉴스
- 호르무즈 좌초 태국 선박서 '실종 선원' 시신 일부 발견 | 연합뉴스
- [길따라] 외국 관광객 국립공원·박물관 무료에 '열광'…퍼주기 관광 논란 | 연합뉴스
- '낙동강변 살인' 누명 피해자, 빗방울에도 물고문 트라우마 | 연합뉴스
- "누가 우리 누나 불렀어"…귀가 돕던 경찰관 폭행한 취객 '집유' | 연합뉴스
- 고물수집 노인 치고 "돌인 줄 알았다"…도주치사 혐의 40대 송치 | 연합뉴스
- 오픈채팅서 만난 미성년자 성폭행·성착취물 제작 30대 징역7년 | 연합뉴스