"반복 프롬프트 자동화"…구글, 제미나이 API 비용 부담↓
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
구글이 개발자의 모델 사용료 부담을 줄이기 위해 인공지능(AI) API 운영 방침을 바꿨다.
구글은 "반복되는 프롬프트나 컨텍스트는 요청 앞부분에 두고, 변동 가능성 큰 내용은 뒷부분에 두는 것이 암시적 캐싱 효과와 효율성을 높일 수 있다"며 "개발자는 캐싱 자동화를 통해 기존보다 모델 사용료를 줄일 수 있다"고 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=김미정 기자)구글이 개발자의 모델 사용료 부담을 줄이기 위해 인공지능(AI) API 운영 방침을 바꿨다.
9일 테크크런치 등 외신에 따르면 구글은 '제미나이 2.5 프로'와 '제미나이 2.5 플레시' 모델에 '암시적 캐싱' 기능을 기본 탑재했다고 밝혔다.
암시적 캐싱은 개발자가 별도 지시하거나 설정하지 않아도 모델이 반복된 프롬프트나 요청을 인식해서 이전 결과를 재활용하는 기능을 의미한다. 명령어가 이전 요청과 접두어가 일치하면 캐시 자동화가 가능하다.

개발자가 암시적 캐싱을 활용하려면 제미나이 2.5 플시 모델에선 최소 1천24토큰, 프로 모델에선 2천48토큰 이상 입력을 해야 한다. 영어 기준으로 750~1천500단어 수준이다.
구글은 "반복되는 프롬프트나 컨텍스트는 요청 앞부분에 두고, 변동 가능성 큰 내용은 뒷부분에 두는 것이 암시적 캐싱 효과와 효율성을 높일 수 있다"며 "개발자는 캐싱 자동화를 통해 기존보다 모델 사용료를 줄일 수 있다"고 밝혔다.
기존 캐싱은 사용자가 자주 사용하는 프롬프트를 직접 지정해야만 했다. 이에 일부 개발자들은 캐싱 효율성이 낮아 API 청구 비용이 부담스럽다고 불만을 제기한 바 있다. 이에 구글 제미나이팀은 시스템 개선을 약속했다.
다만 외신은 암시적 캐싱이 외부 검증을 거치지 않았다고 지적했다. 실질적인 비용 절감 효과는 사용자 반응을 통해 확인될 수 있을 것이라고 평가했다.
테크크런치는 "구글의 모델 사용료 절감 약속을 위한 시스템 정책 변화를 신중히 지켜봐야 한다"고 언급했다.
김미정 기자(notyetkim@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- 구글·애플 사파리 동맹 깨지나…애플 "AI, 검색 엔진 대체할 것”
- "구글 빈자리 노린다"…아이지에이웍스, '애드브릭스 2.0'으로 MMP 시장 공략
- 구글클라우드, '서밋 서울' 취소설 부인…"형식·콘셉트 새로 기획"
- "나보다 나를 더 잘 아는 'AI 튜터'될 것"
- 정부 위약금 면제 판단에...KT "해킹 보상안 조속히 발표"
- 쿠팡 사실상 '1만원' 보상...부정 여론 잠잠해질까
- ‘재단장’ 집중한 유통…AI 기반 맞춤형 서비스로 눈 돌려
- 배민 독주에 균열...새해 승부처는 ‘AI 효율화’
- 임종룡 우리금융 회장 연임 유력…후보추천위원장 "어떤 외부간섭도 없어"
- [르포] 폐배터리 금속 '환생' 여정의 한복판…새해엔 LFP도