구글 클라우드, `제미나이 2.5 플래시` 공개…“AI 성능은 올리고, 비용은 낮췄다”

가성비 모델 ‘제미나이 플래시’ 공개
동일 비용에 GPT-4o 대비 2배 성능
AI 전용 칩 ‘아이언우드’로 생태계 강화

토마스 쿠리안 구글 클라우드 CEO가 '구글 클라우드 넥스트 2025' 현장에서 기조 연설을 진행하고 있다. 구글 클라우드 제공

구글이 성능과 효율을 앞세운 인공지능(AI) 모델과 칩을 동시에 공개하며 차세대 AI 컴퓨팅 시대를 선언했다. 효율성을 앞세워 경쟁력을 높이고, 자체 반도체로 엔비디아 의존도를 줄이려는 의도로 풀이된다.

9일(현지시간) 구글클라우드는 미국 라스베이거스에서 연례 행사인 '넥스트 2025'를 개최하고 지난달 공개한 최신 대형언어모델(LLM) 제미나이 2.5의 보급형 모델인 '제미나이 2.5 플래시'를 공개했다.

'제미나이 2.5 플래시'는 빠른 추론과 낮은 지연시간을 앞세운 실용형 모델로 문서 분석, 고객 상담, 실시간 정보 처리 등 대량 트래픽을 감당해야 하는 서비스에 적합하다. 복잡한 프롬프트에는 보다 정확하게 간단한 요청엔 더욱 빠르게 반응하는 유연한 구조가 특징이다. 이로 인해 낮은 비용으로 빠른 서비스가 가능하다.

'제미나이 2.5 플래시' 현재 버텍스 AI 플랫폼에서 미리보기 형태로 공개됐으며 향후 기업의 온프레미스 환경에서도 사용할 수 있도록 구글 분산형 클라우드(GDC) 기반으로 확대될 예정이다. 구글클라우드는 플래시가 자사 'AI 하이퍼컴퓨터' 환경에서 구동할 경우 1달러당 GPT-4o의 2배, 딥시크-R1의 5배 성능을 낸다고 강조했다.

토마스 쿠리안 구글클라우드 최고경영자(CEO)는 "'플래시'는 프롬프트의 복잡성에 따라 추론의 깊이를 조정하고, 예산에 따라 성능을 제어할 수 있다"며 "일상적 사용사례에 더 적합해졌다"고 말했다.

구글클라우드는 이날 추론에 특화된 7세대 텐서처리장치(TPU) '아이언우드'도 공개했다. AI 딥러닝에 최적화된 칩으로 챗봇, 코드, 미디어 콘텐츠 생성 등 AI 처리 용량에 맞게 확장할 수 있도록 설계됐다.

회사는 아이언우드 성능을 직전 세대 대비 10배 이상 끌어올렸다고 밝혔다. 고대역폭메모리(HBM)를 대거 탑재해 연산 과정에서 데이터를 자주 옮기는 비효율을 줄였고 칩 하나하나를 포드(Pod) 단위로 묶어 대규모 모델을 안정적으로 학습·추론할 수 있도록 했다. 이전 세대보다 메모리 용량은 6배 늘었고, 연산 능력은 42.5엑사플롭스에 달한다. 아이언우드 출시는 AI 전용 칩 공급을 엔비디아에 의존하지 않고 자체 생태계를 키우려는 전략으로도 풀이된다.

구글클라우드는 이밖에도 차세대 GPU인 엔비디아 '베라 루빈' 시리즈를 자사 클라우드 서비스에 도입하고 자체 인프라를 기반으로 한 AI 하이퍼컴퓨터 시스템도 함께 공개했다. 이 시스템은 하드웨어, 소프트웨어는 물론 운영 모델까지 통합한 AI 슈퍼컴퓨팅 플랫폼으로 고성능 AI를 저비용으로 운영할 수 있도록 설계됐다.

플래시와 아이언우드는 향후 구글의 온프레미스 클라우드 플랫폼인 '구글 분산형 클라우드(GDC)'에도 도입된다. 구글은 GDC를 통해 규제나 보안 문제로 외부 클라우드를 사용하기 어려운 기업·기관에서도 제미나이 모델을 활용할 수 있도록 지원할 계획이다. 이를 위해 구글은 델, 엔비디아와 협력해 GDC 환경에 블랙웰 시스템을 탑재하고, 망분리(Air-gapped) 환경에서도 AI 서비스를 운용할 수 있도록 할 예정이다.

쿠리안 CEO는 "핵심 협력사 델을 통해 엔비디아와 제휴를 맺고 제미나이를 '블랙웰' 시스템에 도입했다"며 "제미나이를 망분리 환경에서 사용할 수 있다"고 설명했다.

한편 구글클라우드는 이날 삼성전자를 비롯해 LG AI연구원, 위버스컴퍼니, 카카오, SM 자회사 스튜디오리얼라이브 등과의 AI 협업 사례도 함께 공개했다. 삼성전자는 올 상반기 출시 예정인 '홈 AI 컴패니언 로봇' 볼리에 제미나이 모델을 탑재해 음성·시각·센서 데이터를 실시간으로 처리하는 기능을 구현 중이다.

LG AI연구원은 구글 AI 하이퍼컴퓨터 인프라를 기반으로 자체 대규모언어모델 '엑사원'과 엔터프라이즈 에이전트를 개발했고 위버스컴퍼니는 제미나이 기능을 활용해 빅쿼리 기반 데이터 분석 체계를 구축했다. SM 자회사 스튜디오리얼라이브는 AI 영상 생성 모델 '비오2'를 시범 도입해 K팝 팬덤을 위한 콘텐츠 제작에 활용하고 있으며, 작업 시간과 품질을 동시에 개선하고 있다.

쿠리안 CEO는 "지난해 구글 클라우드와 구글 워크스페이스에서 제품 개선이 3000건 이상이었다. 현재 개발자 400만여명이 제미나이를 활용해 개발한다"며 "구글 워크스페이스 비즈니스 사용자에게는 매달 20억건 이상의 AI 보조(Assist)가 제공돼 업무 수행방식이 근본적으로 바뀌고 있다"고 강조했다.

유진아기자 gnyu4@dt.co.kr

디지털타임스

IT/과학

구글 클라우드, `제미나이 2.5 플래시` 공개…“AI 성능은 올리고, 비용은 낮췄다”