사람처럼 대화하는 AI비서 '아스트라' 공개

이덕주 특파원(mrdjlee@mk.co.kr) 2024. 5. 15. 18:00
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

구글이 인간과 실시간으로 소통하는 멀티모달 AI에이전트 '프로젝트 아스트라'를 공개하면서 AI에이전트 개발 경쟁이 본격화됐다.

14일(현지시간) 미국 캘리포니아주 마운틴뷰 본사에서 개최한 구글 연례 개발자 회의(I/O)에서 구글은 범용 AI어시스턴트인 '프로젝트 아스트라'를 공개했다.

기조연설에서 공개된 영상에서 '프로젝트 아스트라'는 오픈AI 'GPT-4o'의 보이스모드보다 성능이 떨어지는 것처럼 보였기 때문이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카메라로 보며 영상 소통
스마트글라스 부활에 관심

◆ 불붙은 AI플랫폼 경쟁 ◆

구글이 인간과 실시간으로 소통하는 멀티모달 AI에이전트 '프로젝트 아스트라'를 공개하면서 AI에이전트 개발 경쟁이 본격화됐다. 또한 이런 AI에이전트와 소통하는 새로운 하드웨어로 스마트글라스를 비롯한 새로운 시도가 계속 나올 것으로 예상된다.

14일(현지시간) 미국 캘리포니아주 마운틴뷰 본사에서 개최한 구글 연례 개발자 회의(I/O)에서 구글은 범용 AI어시스턴트인 '프로젝트 아스트라'를 공개했다.

AI가 자신이 보고 들은 것을 기억하고 사고하면서, 사용자와 실시간으로 음성대화를 할 수 있도록 AI에이전트를 만드는 프로젝트다.

하지만 바로 전날인 13일 오픈AI가 예정에 없던 깜짝 라이브 행사를 통해 'GPT-4o'를 공개하면서 '프로젝트 아스트라'에 대한 관심은 찬물을 끼얹은 듯 식어버렸다.

기조연설에서 공개된 영상에서 '프로젝트 아스트라'는 오픈AI 'GPT-4o'의 보이스모드보다 성능이 떨어지는 것처럼 보였기 때문이다. 사람의 감정을 인식하고 노래까지 불러주는 GPT-4o에 비해 '아스트라 프로젝트'는 미완성처럼 보였기 때문이다.

이런 평가를 인식해서인지 구글은 이날 일부 기자들을 대상으로 '프로젝트 아스트라'를 체험할 수 있는 기회를 제공했다.

관심은 '프로젝트 아스트라' 영상에 등장한 스마트글라스에 더 쏠렸다. 구글이 2013년 출시했지만 크게 실패한 스마트글라스가 AI의 등장으로 다시 주목을 받게 된 것이다. 멀티모달 능력을 갖춘 AI가 탑재된 스마트글라스는 음성과 시각을 통해 소통하는 것이 가능해지기 때문이다.

XR기기를 만드는 메타는 지난해 공개한 신형 레이밴 스마트글라스에 이미지와 음성 인식 능력을 갖춘 '메타AI'를 탑재시켰다. 사용자가 보고 있는 것을 AI도 보고 이에 대해서 대화할 수 있다. 다만 프로젝트 아스트라에 등장한 제미나이 AI보다는 능력이 높지 않은 것으로 전해졌다.

최근 생성형AI가 부상하면서 AI와 음성으로 상호작용을 하는 새로운 하드웨어로 스마트글라스, AI핀, 목걸이, 이어버드 등 다양한 제품이 시도되고 있다.

[실리콘밸리 이덕주 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?