[현실화된 AGI] "내 안경 어딨어?"묻자 "책상 위에"… 인간에 더 가까워진 AI

팽동현 2024. 5. 15. 18:51
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글, 슈퍼휴먼 '아스트라' 개발
검색 등 전 기능 '제미나이' 탑재
배경음·감정 표현 사람처럼 표출
오픈AI, 하루 앞서 GPT-4o 공개
데미스 허사비스 구글 딥마인드 최고경영자가 14일 미국 실리콘밸리 구글 본사에서 열린 연례 개발자 회의에서 AGI 개발 프로젝트인 '프로젝트 아스트라'를 소개하고 있다. 구글 제공

"실시간 멀티모달 AI비서는 사람처럼 복잡하고 역동적인 세계를 이해하고 반응해야 한다. 맥락을 이해하고 조치를 취할 수 있도록 보고 기억해야 한다. 또 학습 가능하고 개인적이야 하며 지연이나 지체 없이 자연스럽게 대화할 수 있어야 한다. "

일반 AI(AGI) 시대의 도래를 선언한 데미스 허사비스 구글 딥마인드 CEO는 AI비서가 단순히 대화하는 게 아니라 실제로 사람을 대신해서 온갖 종류의 일을 해줄 것이라고 밝혔다. 또 그중 일부는 사람의 개인적인 취향과 맥락을 이해하는 협력자이자 동반자 역할을 할 것이라고 말했다. 구글이 야심차게 개발하는 AGI '아스트라'는 다른 AI들보다 진정한 '실시간 AI 비서'에 훨씬 더 가깝다고 강조했다.

아스트라는 오픈AI에 생성형 AI 선수를 빼앗긴 구글이 AGI, 즉 슈퍼휴먼 경쟁에서는 선두에 서겠다는 의지를 담은 프로젝트다. AGI는 사람과 거의 비슷하거나 오히려 더 뛰어난 지능을 갖춘 AI를 말한다. AI가 사람과 마찬가지로 사물이나 상태 혹은 특정 모습을 알아차리고 분별해내는 인지 능력을 갖는 것으로, 다양한 영역에서 기존에 학습한 지식을 활용해 문제를 해결하는 것도 가능하다.

이날 시연 영상에서 한 여성이 스마트폰 카메라로 사무실을 비추며 AI와 대화하는 모습이 전해졌다. 이 여성이 스피커의 일부를 비추고 "이걸 뭐라고 부르냐"고 묻자, AI는 스피커라고 알아맞혔다. 창 밖을 보여주며 위치를 묻자 AI는 "기차역으로 유명한 영국 런던의 킹스크로스 지역인 것으로 보인다"고 말했다. "내 안경을 어디 있는지 기억나느냐"고 묻자 곧장 "책상 위 빨간 사과 옆에 있다"고 말했다. 이용자가 이동하며 포착된 장면을 기억하고 판단해서 실시간으로 알려준 것이다.

그동안 최소 30년, 적어도 10년으로 꼽히던 AGI 출현 예측 시기가 최근 5년 내외로 앞당겨진 가운데 구글이 당장 연내에 일부 기능을 보이겠다고 선언하면서 빅테크간 기술 경쟁이 더욱 뜨거워질 전망이다. 특히 하루 앞서 음성 AI비서 'GPT-4o'를 선보인 오픈AI와의 격돌이 예상된다. 오픈AI의 GPT-4o는 텍스트, 영상, 오디오를 아우르는 멀티모달 모델의 새 지평을 열었다는 평가를 받는다. 사람들 사이 일상처럼 말을 끊거나 끼어들어도, 또는 PC 화면이나 스마트폰 카메라로 함께 뭔가를 보면서도 챗GPT와 실시간으로 음성대화를 이어가며 도움을 얻을 수 있다.

미라 무라티 오픈AI CTO는 "GPT-4o의 특별한 점은 무료 사용자를 포함한 모든 사용자에게 GPT-4 수준의 인텔리전스를 제공한다는 것"이라며 "훨씬 더 빠르고 텍스트, 비전, 오디오 전반에 걸쳐 기능이 향상됐다"고 말했다. GPT-4o는 특히 평균 2.8초(GPT-3.5)와 5.4초(GPT-4)였던 음성 응답 시간을 사람과 유사한 0.2~0.3초 수준으로 줄였다. 또 여러 화자나 배경소음, 노래 및 감정표현 등을 자연스럽게 인식하고 표출한다.

이날 시연에서 시연자가 "지금 시연 중이라 긴장된다"고 하자 GPT-4o는 심호흡을 권했고, 일부러 과하게 헐떡이자 '당신은 진공청소기가 아니다'고 핀잔을 주기도 했다. '잠들지 못하는 친구를 위해 로봇이 사랑에 빠진 이야기를 들려 달라'고 하고서 중간에 여럿이 끼어들어 '감정을 더 실어 달라' '로봇 목소리로 바꿔줘' '노래하는 식으로 해라' 등 요청을 해도 즉각 들어줬다. GPT-4o와의 대화는 실제 사람과의 대화와 구분하기 어려울 정도로 자연스럽게 이어졌다. 샘 올트먼 오픈AI CEO는 이날 자신의 블로그에 "영화에 나오는 AI 같은 느낌이다. 이것이 현실이라는 사실이 아직도 조금 놀랍다"고 썼다.

한 단계 진화한 AI는 검색엔진, 로봇, 스마트폰, 교육 등 전 영역에 파고들어 산업을 재편할 전망이다. 구글은 글로벌 점유율이 90%에 달하는 검색엔진에 제미나이를 탑재한다. 검색, 안드로이드 등 전 제품을 '제미나이 생태계'로 묶는다는 구상이다. 마이크로소프트(MS)는 오픈AI의 GPT에 기반한 생성형 AI 코파일럿을 전 제품에 탑재했다. 이를 바탕으로 클라우드 사업도 고속 성장하고 있다.

물리세계와 맥락까지 이해하는 AGI는 로봇과의 결합도 앞당길 것으로 예측된다. 그동안 컴퓨터 세상에 머물렀던 AI가 물리세계와 연결되면서 로봇에서 또 한번 AI 혁명이 일어날 것이란 전망이다. 이미 오픈AI를 비롯한 빅테크들은 앞다퉈 AI로봇 상용화에 뛰어들었다. 여준구 한국로봇융합연구원장은 "AI가 물리세계와 연결되면 또한번 AI 혁명이 일어날 것"이라며 "AI에 이은 다음 '빅웨이브'인 AI로봇 연구개발에 집중 투자할 필요가 있다"고 밝혔다. 조성배 연세대 AI연구원장은 "기존에 AI모델들이 주로 데이터나 파라미터 규모를 늘리는 식으로 성능을 높여왔다면, 이번에는 텍스트·비디오·오디오를 아울러 실시간으로 통합 처리할 수 있게 했다는 점에서 멀티모달 모델로서 진일보했다고 볼 수 있다"고 말했다. 다만 조 교수는 사람과 같은 수준의 AGI는 아직 갈 길이 많이 남았다는 견해를 밝혔다. 원종윤 동명대 시각디자인학과 교수는 "오픈AI의 'GPT-4o'와 구글의 '제미나이' 탑재 등을 계기로 기존 AI 교육 방식이 크게 달라지고, 교육에서 다뤄지는 이슈도 달라질 것"이라고 말했다. 팽동현기자 dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?