AI가 사진 속 정보 검색 척척… 구글 '제미나이 시대' 연다

홍창기 2024. 5. 15. 19:10
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"제미나이가 당신이 잠깐 깜박한 차 번호판의 번호를 바로 알려줄 것이다. 또 제미나이는 당신의 딸이 수영을 시작한 날짜도 찾아줄 것이다."

순다르 피차이 구글 최고경영자(CEO)가 14일(현지시간) 구글의 멀티모달((Multimodal) 인공지능(AI) 모델 제미나이(Gemini)의 AI 사진 검색 기능' 애스크 포토'(Ask photo)를 설명하면서 든 예시다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

美구글 본사서 연례개발자회의
피차이 CEO 등 임원진 총출동
제미나이 탑재 정식버전 첫 공개
AI사진 검색 기능에 일제 환호
추론·기획 가능한 AI도 선보여
오픈AI와 AI서비스 ‘진검승부’
순다르 피차이 구글 최고경영자(CEO)가 14일(현지시간) 미국 캘리포니아주 마운틴뷰 구글 본사 연례개발자회의(I/O) 회의장인 쇼어라인 엠피씨어터로 웃으며 입장하고 있다. 구글 제공
【파이낸셜뉴스 실리콘밸리=홍창기 특파원】 "제미나이가 당신이 잠깐 깜박한 차 번호판의 번호를 바로 알려줄 것이다. 또 제미나이는 당신의 딸이 수영을 시작한 날짜도 찾아줄 것이다."

순다르 피차이 구글 최고경영자(CEO)가 14일(현지시간) 구글의 멀티모달((Multimodal) 인공지능(AI) 모델 제미나이(Gemini)의 AI 사진 검색 기능' 애스크 포토'(Ask photo)를 설명하면서 든 예시다. 올 여름 출시될 '애스크 포토'를 피차이 CEO가 설명하자 이날 미국 캘리포니아주 마운틴뷰 구글 본사를 찾은 4300여명이 일제히 환호를 쏟아냈다.

14일(현지시간) 미국 캘리포니아주 마운틴뷰 본사에서 개최된 연례개발자회의(I/O)에 참석한 사람들이 쇼어라인 엠피씨어터에서 구글 임원의 발표를 듣고 있다. 사진=홍창기 기자

■25년 만에 검색엔진에 AI 탑재

이날 연례개발자회의(I/O)에서는 피차이 CEO를 비롯해 데미스 허사비스 구글 딥마인드 CEO, 리즈 리드 검색(서치) 부문 부사장, 씨씨 샤오 제미나이 담당 구글 어시스턴트 부사장, 제임스 마니카 기술 및 사회 수석부사장 등이 무대에 올랐다. 이들은 무대에서 인공지능(AI)를 121번이나 언급, AI 선구자는 구글이라는 점을 인식시키기 위해 노력했다.

구글은 이날 제미나이가 탑재된 정식 검색 엔진을 공식 출시했다. 구글의 검색 엔진에 AI가 탑재된 것은 구글 검색이 등장한 이후 25년만에 가장 큰 변화다. 구글은 이전에도 제미나이를 탑재한 AI 검색서비스를 해왔지만 정식 버전은 아니었다. 피차이 CEO는 이를 '제미나이의 시대'라고 명명했다.

이날부터 미국에서 바로 사용할 수 있는 AI 오버뷰는 빠른 요약과 관련 링크를 제안, 이용자가 효율적으로 정보를 탐색하고 복잡한 질문에 대한 답을 찾도록 도와준다. 이에 대해 리즈 리드 구글 검색 부사장은 "검색에서 고객의 수고를 덜어주는 것이 목표다"라며 AI 오버뷰의 성능을 자신했다.

■음성대화, 텍스트로 영상 제작

구글은 또 이날 추론과 기획이 가능한 AI 에이전트 '프로젝트 아스트라'도 공개했다. '프로젝트 아스트라'는 인간처럼 보고 듣고 배우는 미래형 AI 에이전트 개발을 위한 구글의 AI 비전이다. 구글은 '프로젝트 아스트라'개발을 위한 첫 단계로 연내에 제미나이와 음성으로 자연스럽게 대화할 수 있는 '제미나이 라이브'를 출시한다.

피차이 CEO는 "2월에 선보인 멀티모달 AI 제미나이 1.5프로의 경우 대화와 오디오 및 이미지 인식 기능 등이 대폭 향상됐다"라고 밝혔다. 코드 생성과 논리적 추론 등이 발전했다는 설명이다. 그는 "제미나이 1.5 프로는 한국어를 포함해 35개 언어로 출시할 것"이라고 덧붙였다.

아울러 구글은 이날 빠르고 더 효율적인 경량 제미나이 모델인 '제미나이 1.5 플래시'를 처음으로 공개했다. 최신형 동영상 생성 모델인 비오(Veo)와 텍스트를 이미지로 바꿔주는 이마젠 3(Imagen 3)도 소개했다. 다만 이날 구글이 선보인 AI 서비스는 오픈AI가 이미 서비스하고 있는 기능과 유사한 것이 많아 오픈AI와의 경쟁은 피할 수 없을 것으로 보인다.

텍스트를 통해 동영상을 생성하는 비오, 이마젠 3, AI 음악 생성 모델인 릴리아 등이 그것이다. 구글의 이같은 서비스는 경쟁사인 오픈AI가 이미 소라(Sora)와 달리(DALL-E) 등을 통해 서비스하고 있다. 제미나이의 최첨단 음성 기술을 통해 대화할 수 있는 '제미나이 라이브'도 오픈AI의 챗GPT 음성 기능과 상당히 유사하다.

한편, 이날 구글은 하드웨어 최신 6세대 서버용 AI 반도체(TPU) '트릴리움'도 발표했다. 트릴리움은 뛰어난 성능과 에너지 효율성을 갖췄다. 이전 세대 대비 칩당 컴퓨팅 성능이 4.7배나 향상됐다. 구글은 트릴리움이 최고 성능 인프라로 클라우드 고객의 디지털 트랜스포메이션을 지원한다고 설명했다.

theveryfirst@fnnews.com

Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?