오픈AI·구글, 나란히 경량 AI 공개…'속도·비용 경쟁' 본격화

오픈AI와 구글이 같은 날 나란히 경량 인공지능(AI) 모델을 공개했다. 최고 성능 경쟁과 별개로, 실제 이용이 많은 일상 대화와 대규모 업무 처리 구간에서는 더 빠르고 가벼운 모델로 승부를 걸기 시작한 것이다.

4일 업계에 따르면 오픈AI는 3일(현지시간) 일상 대화용 경량 모델 ‘GPT-5.3 인스턴트’를 공개했다. 오픈AI는 이번 모델이 더 정확한 답변, 웹 검색 결과와 자체 추론을 섞은 정교한 응답, 불필요한 거절과 장황한 단서 문구 감소에 초점을 맞췄다고 밝혔다. 기존 ‘GPT-5.2 인스턴트’가 과도하게 방어적이거나 훈계조로 느껴진다는 이용자 피드백을 반영한 조정이다.

오픈AI는 특히 “질문에 답할 수 있는 상황에서도 지나치게 거절하거나 경고 문구를 길게 붙이는 문제를 줄였다”고 설명했다. 웹 검색을 사용할 때도 단순히 검색 결과를 나열하는 대신, 맥락을 정리해 바로 활용할 수 있는 답변을 내놓는 방향으로 개선했다고 밝혔다. 고위험 분야 내부 평가에서는 웹 사용 시 환각 비율이 이전 모델보다 26.8%, 내부 지식만 쓸 때는 19.7% 줄었다고 제시했다.

다만 비영어권 완성도는 과제로 남겼다. 오픈AI는 한국어와 일본어 등 일부 언어에서 답변 문체가 어색하거나 직역투로 들릴 수 있다고 밝혔다. GPT-5.3 인스턴트는 이날부터 챗GPT 이용자에게 순차 적용된다. 개발자는 오픈AI의 개발자용 서비스에서 이 모델을 사용할 수 있다. 기존 GPT-5.2 인스턴트는 유료 이용자를 대상으로 6월 3일까지 유지된다.

구글도 같은 날 ‘제미나이 3.1 플래시-라이트’를 선보였다. 이 모델은 개발자용 ‘구글 AI 스튜디오’와 기업용 ‘버텍스 AI’를 통해 시범 제공된다. 구글은 이를 제미나이 3 시리즈 가운데 가장 빠르고 비용 효율적인 모델이라고 규정했다. 번역, 콘텐츠 검수, 사용자 인터페이스 생성, 시뮬레이션처럼 호출량이 많은 업무를 겨냥한 제품이다.

가격은 입력 100만 토큰당 0.25달러, 출력 100만 토큰당 1.50달러다. 구글은 이 모델이 제미나이 2.5 플래시 대비 첫 답변 생성 속도는 2.5배, 출력 속도는 45% 높으면서도 비슷하거나 더 나은 품질을 낸다고 설명했다.

경량 모델 경쟁은 보급형 모델 확대보다, 무료 이용자와 기업 고객이 몰리는 대규모 처리 구간의 비용을 누가 더 낮추느냐로 옮겨가는 모습이다.

아주경제

경제

오픈AI·구글, 나란히 경량 AI 공개…'속도·비용 경쟁' 본격화