오픈AI·구글, 나란히 경량 AI 공개…'속도·비용 경쟁' 본격화

한영훈 2026. 3. 4. 09:49
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[출처=연합뉴스]
오픈AI와 구글이 같은 날 나란히 경량 인공지능(AI) 모델을 공개했다. 최고 성능 경쟁과 별개로, 실제 이용이 많은 일상 대화와 대규모 업무 처리 구간에서는 더 빠르고 가벼운 모델로 승부를 걸기 시작한 것이다.

4일 업계에 따르면 오픈AI는 3일(현지시간) 일상 대화용 경량 모델 ‘GPT-5.3 인스턴트’를 공개했다. 오픈AI는 이번 모델이 더 정확한 답변, 웹 검색 결과와 자체 추론을 섞은 정교한 응답, 불필요한 거절과 장황한 단서 문구 감소에 초점을 맞췄다고 밝혔다. 기존 ‘GPT-5.2 인스턴트’가 과도하게 방어적이거나 훈계조로 느껴진다는 이용자 피드백을 반영한 조정이다.

오픈AI는 특히 “질문에 답할 수 있는 상황에서도 지나치게 거절하거나 경고 문구를 길게 붙이는 문제를 줄였다”고 설명했다. 웹 검색을 사용할 때도 단순히 검색 결과를 나열하는 대신, 맥락을 정리해 바로 활용할 수 있는 답변을 내놓는 방향으로 개선했다고 밝혔다. 고위험 분야 내부 평가에서는 웹 사용 시 환각 비율이 이전 모델보다 26.8%, 내부 지식만 쓸 때는 19.7% 줄었다고 제시했다.

다만 비영어권 완성도는 과제로 남겼다. 오픈AI는 한국어와 일본어 등 일부 언어에서 답변 문체가 어색하거나 직역투로 들릴 수 있다고 밝혔다. GPT-5.3 인스턴트는 이날부터 챗GPT 이용자에게 순차 적용된다. 개발자는 오픈AI의 개발자용 서비스에서 이 모델을 사용할 수 있다. 기존 GPT-5.2 인스턴트는 유료 이용자를 대상으로 6월 3일까지 유지된다.

구글도 같은 날 ‘제미나이 3.1 플래시-라이트’를 선보였다. 이 모델은 개발자용 ‘구글 AI 스튜디오’와 기업용 ‘버텍스 AI’를 통해 시범 제공된다. 구글은 이를 제미나이 3 시리즈 가운데 가장 빠르고 비용 효율적인 모델이라고 규정했다. 번역, 콘텐츠 검수, 사용자 인터페이스 생성, 시뮬레이션처럼 호출량이 많은 업무를 겨냥한 제품이다.

가격은 입력 100만 토큰당 0.25달러, 출력 100만 토큰당 1.50달러다. 구글은 이 모델이 제미나이 2.5 플래시 대비 첫 답변 생성 속도는 2.5배, 출력 속도는 45% 높으면서도 비슷하거나 더 나은 품질을 낸다고 설명했다.

경량 모델 경쟁은 보급형 모델 확대보다, 무료 이용자와 기업 고객이 몰리는 대규모 처리 구간의 비용을 누가 더 낮추느냐로 옮겨가는 모습이다.