오픈AI, `GPT-4.1` API로 공개…"코딩·효율성↑"

팽동현 2025. 4. 15. 10:38
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

챗GPT 개발사 오픈AI가 새로운 인공지능(AI) 모델 'GPT-4.1'을 14일(현지시간) 공개했다.

회사가 AI모델 중 가장 빠르고 저렴하다고 소개한 GPT-4.1 나노도 기존 GPT-4o 미니보다 전반적으로 앞선 성능을 제공하며, 분류나 자동완성 등 낮은 지연시간이 필요한 작업에 적합하다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

GPT-4.1과 GPT-4o 모델들 간 응답 지연시간에 따른 지능수준 비교. 오픈AI 제공

챗GPT 개발사 오픈AI가 새로운 인공지능(AI) 모델 'GPT-4.1'을 14일(현지시간) 공개했다.

GPT-4.1은 기본모델과 'GPT-4.1 미니' 및 'GPT-4.1 나노' 등 3종으로 구성됐고, 우선 응용프로그램인터페이스(API)를 통해서만 이용 가능하다. 지식 컷오프(학습 기준 시점)는 2024년 6월로 갱신됐다.

GPT-4.1 모델들은 경쟁사들의 최근 추세에 맞춰 100만 토큰의 콘텍스트창을 지원해 GPT-4o(12만8000개)보다 훨씬 많은 내용을 입력할 수 있고, 그에 걸맞게 긴 콘텍스트 활용 능력 향상에도 초점을 맞췄다.

3종 모델 모두 전반적인 성능에서 기존 GPT-4o와 GPT-4o 미니를 능가하며, 특히 코딩과 인스트럭션(지시) 수행 능력에 있어 진전을 이뤘다고 회사는 설명했다. 기업과 개발자들의 수요를 노린 모델들이다.

오픈AI에 따르면 GPT-4.1은 코딩 벤치마크(SWE-bench Verified)에서 GPT-4o보다 21.4%, GPT-4.5보다 26.6% 높은 성적을 거뒀다. 코드 저장소를 탐색하고 코드를 테스트·작성하는 능력이 개선됐다. 다만 앞서 구글 제미나이 2.5 프로와 앤스로픽 클로드 3.7 소네트가 낸 점수보다는 낮았다. 또 GPT-4.1은 대용량 파일과 다양한 코드 취급에 있어 GPT-4o의 두 배 이상, GPT-4.5보다도 8% 높은 점수를 관련 벤치마크(Aider's polyglot)에서 기록했다. 출력 토큰 한도도 GPT-4o의 두 배 수준인 3만2768개로 늘렸다.

인스트럭션 추종 능력의 경우 관련 벤치마크(Scale's MultiChallenge)에서 GPT-4o보다 10.5% 향상된 결과를 보였다. 멀티턴 대화에서 과거 정보를 더 잘 골라내고, 어려운 프롬프트에 대한 응답 능력이 크게 개선됐다. 오픈AI는 관련 내부 평가를 개발해 이용자가 입력한 형식준수, 부정명령, 순차이행, 요구사항포함, 순서지정 등을 더 잘 따르도록 하고, 정보가 없거나 해당치 않으면 모르겠다고 응답하라는 지시 또한 더 잘 받아들이게 했다.

효율성 또한 이번에 오픈AI가 강조한 대목으로, 추론 시스템 개선으로 가격을 낮췄다. GPT-4.1 미니는 소형 모델임에도 많은 벤치마크에서 GPT-4o를 능가, 인텔리전스 평가에선 GPT-4o와 유사한 수준임에도 지연시간은 절반가량이고 비용도 83% 절감을 이뤘다. 회사가 AI모델 중 가장 빠르고 저렴하다고 소개한 GPT-4.1 나노도 기존 GPT-4o 미니보다 전반적으로 앞선 성능을 제공하며, 분류나 자동완성 등 낮은 지연시간이 필요한 작업에 적합하다.

GPT-4.1 모델들도 고성능의 이미지 이해 기능을 제공, GPT-4.1 미니도 이미지 벤치마크에서 GPT-4o를 앞질렀다. 비디오 처리와 같은 멀티모달 사용 사례에서도 긴 콘텍스트에 대해 향상된 처리 능력을 활용, 관련 벤치마크(Video-MME)에서 GPT-4o보다 6.7% 개선된 점수를 기록했다. 이밖에 오픈AI는 GPT-4.1이 긴 콘텍스트에 대해서도 성능 저하가 덜한 점을 강조, 모델의 해당 처리 능력을 평가하는 기능(오픈AI-MRCR)을 오픈소스로 함께 공개했다.

앞서 오픈AI는 챗GPT에서 GPT-4를 이달 말부터 더 이상 지원하지 않고 GPT-4o로 대체한다고 발표한 바 있다. 이번에 API를 통한 지원 모델에 GPT-4.1을 추가하면서 대신 GPT-4.5 프리뷰 버전의 지원을 3개월 뒤인 7월 14일 종료하기로 했다. GPT-4.1이 더 낮은 비용과 지연시간으로 유사한 성능을 제공한다는 이유다. 회사는 추론모델 o3 정식버전과 o4 미니버전도 조만간 내놓을 예정이다.

샘 올트먼 오픈AI CEO는 자신의 X(옛 트위터)에서 "GPT-4.1 모델들은 코딩, 인스트럭션 팔로잉, 긴 콘텍스트에 매우 뛰어나다"면서 "벤치마크에서도 강한 모습을 보이지만 우린 실제 유용성을 갖추는 데 중점을 뒀으며, 이에 개발자들도 만족하는 것 같다"고 말했다.팽동현기자 dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.