구글 클라우드, 버텍스AI 업데이트…"저비용·고성능 엔터프라이즈 '최적합'"

제미나이 1.5 플래시·제미나이 1.5 프로 정식 버전 출시

[아이뉴스24 윤소진 기자] 구글 클라우드는 제미나이 1.5 플래시 및 제미나이 1.5 프로 정식 버전을 출시하고, 컨텍스트 캐싱∙프로비저닝 처리량 등 모델 성능 및 비용 최적화 기능 등 자사 기업용 인공지능(AI) 플랫폼 '버텍스 AI'의 기능을 대거 업데이트했다고 8일 밝혔다.

먼저 지난 5월 프리뷰 버전으로 선보였던 제미나이 1.5 플래시를 공식 출시했다. 제미나이 1.5 플래시는 짧은 지연 시간과 가격 경쟁력, 획기적인 100만 토큰 컨텍스트 윈도우를 결합해 리테일 기업의 채팅 에이전트부터 문서 처리, 전체 데이터를 통합 분석할 수 있는 리서치 에이전트에 이르기까지 대규모 사례에 광범위하게 사용될 수 있다.

특히 제미나이 1.5 플래시는 성능, 지연 시간, 비용 효율성 면에서 동급 모델 대비 강력한 이점을 제공한다고 회사 측은 강조했다. GPT-3.5 터보 대비 60배가량 더 긴 100만 개의 토큰 컨텍스트 윈도우를 제공하며, 1만 자 입력 기준 평균 40% 더 빠른 속도를 자랑한다. 또한 3만 2천 자 이상 입력 시 컨텍스트 캐싱(context caching) 기능으로 GPT-3.5 터보 대비 입력 비용을 최대 4배 절감시켜 준다는 설명이다.

최대 200만 개의 토큰 컨텍스트 윈도우를 지원하는 제미나이 1.5 프로도 정식 버전으로 출시, 다른 모델에서는 처리하기 어려운 다양한 멀티모달 사례를 지원한다.

구글 클라우드는 고객이 제미나이 1.5 프로 및 제미나이 플래시 모델의 방대한 컨텍스트 윈도우를 효율적으로 활용할 수 있도록 해당 모델에 컨텍스트 캐싱(context caching) 기능을 프리뷰 버전으로 제공한다.

버텍스 AI 컨텍스트 캐싱은 자주 사용하는 컨텍스트의 캐시 데이터를 활용해 고객이 최대 76%까지 비용을 대폭 절감할 수 있도록 돕는다. 컨텍스트 캐싱 API를 제공하는 업체는 현재 구글 클라우드가 유일하다.

이밖에 구글 클라우드는 기업이 자사의 생성형 AI 에이전트를 특정 제공 업체의 데이터로 그라운딩 할 수 있는 새로운 서비스를 올해 3분기부터 제공한다. 이를 통해 기업은 타사 데이터를 생성형 AI 에이전트에 통합해 고유한 사용 사례를 발굴하고, AI 경험 전반에서 엔터프라이즈 지식을 더 많이 도출할 수 있다. 구글 클라우드는 해당 서비스 제공을 위해 무디스(Moody’s), 모건스탠리 캐피털 인터내셔널(MSCI), 톰슨 로이터(Thomson Reuters), 줌인포(Zoominfo) 등 유수의 기업과 협력 중이다.

그라운딩 위드 하이 피델리티 모드도 프리뷰 버전으로 선보였다. 하이 피델리티 모드는 여러 문서를 아우르는 요약, 금융 데이터 전반에서 데이터 추출, 사전 정의된 문서 세트 처리와 같은 그라운딩 사례를 지원하기 위해 특별히 구축됐다. 또한 고객이 제공한 컨텍스트만을 사용해 답변을 생성하도록 미세 조정된 제미나이 1.5 플래시를 기반으로 구동돼 높은 사실 정확성을 보장한다.

구글의 최신 이미지 생성 모델 이마젠3는 속도와 프롬프트 이해력을 더 향상시켰으며, 구글클라우드에서는 이마젠3를 비롯해 타사모델부터 오픈 모델까지 모두 활용할 수 있다. 최근 클로드 3.5 소넷이 버텍스AI에 추가됐으며 올 하반기 미스트랄 모델도 추가한다.

구글 클라우드는 초경량의 최첨단 오픈 모델 제품군 젬마의 후속 모델 '젬마 2'를 발표했다. 이 모델은 90억 개(9B)와 270억 개(27B) 파라미터 사이즈로 제공된다. 구글 클라우드는 "이전 버전보다 훨씬 더 강력하고 효율적이며, 개선된 보안 기능이 내장됐다"며 "이번 달부터 버텍스 AI에서 젬마 2를 이용할 수 있다"고 전했다.

/윤소진 기자(sojin@inews24.com)

IT/과학

구글 클라우드, 버텍스AI 업데이트…"저비용·고성능 엔터프라이즈 '최적합'"