오픈AI 'GPT-4o' vs 구글 '제미나이'…생성형 AI 경쟁 재점화
'챗GPT'의 개발사인 오픈AI와 '제미나이'의 구글이 하루 차이로 자사의 최신 버전을 발표하며 엄청난 신경전을 펼쳤다. 구글이 지난 15일(이하 한국시간 기준) 연례 개발자 회의를 통해 제미나이 업그레이드 버전을 발표하기 하루 전인 14일 오픈AI는 'GPT-4o'(GPT-포오)를 공개하며 미리 맞불을 놓았다.
구글은 전세계 온라인 생태계를 장악하고 있는 구글 제품과의 연계를 통해 자연스레 '제미나이 생태계'를 구축하고 있는 것을 강조했고, 오픈AI는 텍스트를 뛰어넘어 실시간 음성 대화를 통해 인간 수준의 질문과 답을 할 수 있는 버전을 선보이며 각자의 특장점을 강조하는데 집중했다.
여기에 애플이 챗GPT와 제미나이의 기술을 접목한 음성비서 '시리'를 다음달 발표할 것으로 예상되면서, 디바이스와 결합된 생성형 AI의 파급력은 엄청날 것으로 기대된다. 이를 둘러싼 빅테크 기업들의 '합종연횡'이 더 활발해질 것은 물론이다.
▶'마법'처럼 느껴진다
그동안 텍스트에 집중됐던 생성형 AI가 GPT-4o처럼 음성으로 확대된 것은 대중화로 이르는 획기적인 교두보라 할 수 있다.
특히 청각과 시각으로도 추론해 이를 말할 수 있고, 마치 인간끼리 대화를 하는 정도의 속도를 제공하면서 AI에 대한 거부감은 훨씬 줄어들 것으로 기대된다.
오픈AI의 미라 무라티 최고기술책임자(CTO)가 14일 라이브 행사를 통해 공개한 GPT-4o의 응답시간은 최소 0.232초, 평균 0.32초 불과하다. 이전 모델인 GPT-3.5가 평균 2.8초, GPT-4가 5.4초쯤 걸린 것을 감안하면 상당한 기술 진일보다. 인간의 응답시간과 거의 비슷한 것은 물론 답을 제공하는 도중에 끼어들어도 대화가 계속 이어지는 것 역시 이를 잘 보여준다.
이날 시연에서 '잠을 잘 못자는 친구를 위해 이야기를 들려달라'고 요구하자 GPT-4o는 할머니가 손주들에게 들려주듯 "옛날 옛적에"로 시작되는 얘기를 시작했고, 좀 더 감정을 섞어달라고 하자 마치 배우나 성우처럼 더 극적인 목소리로 대화를 이어나갔다. 또 '긴장이 되는데 진정하려면 어떻게 할까'라는 질문에는 '숨을 깊이 들이마셔봐'라는 격려의 답변이 돌아왔다. 이외에도 종이에 적힌 수학 문제를 단계별 과정을 제공하며 풀거나, 서로 다른 언어간의 통역을 실시간으로 제공하기도 했다.
무엇보다 이제는 이성적인 정보 제공뿐 아니라 감성까지 담은 커뮤니케이션이 가능해졌다는 면에서 10년 전에 선보였던 영화 '허'(her·그녀)에서 주인공과 AI의 소통을 연상케 한다. 샘 올트먼 오픈AI 최고경영자(CEO)는 이날 발표에 앞선 지난 10일 자신의 엑스(X·전 트위터)에 "나에게는 (새 모델이) 마법처럼 느껴졌다"고 썼고, 발표 후에는 'her'라고 쓰며 이를 언급하기도 했다.
이날부터 새 모델을 사용해 애플리케이션을 구축할 수 있도록 API(응용 프로그램 인터페이스)를 통해서 무료로 이용할 수 있으며, 이날 시연된 AI 음성 모드는 몇 주 내에 공개되는 등 빠른 행보를 보여주고 있다.
▶'제미나이의 시대'에 살고 있다
15일 구글 연례 개발자 회의에서 공개된 구글의 최신 AI 모델 '제미나이'의 가장 큰 경쟁력은 바로 구글 그 자체라 할 수 있다.
현재 20억명 이상의 이용자가 검색과 포토, 워크스페이스, 안드로이드 등 다양한 구글 제품을 통해 제미나이를 이미 자연스레 경험하고 있는데, 한층 진화된 버전을 통해 완벽히 통합된 '제미나이 생태계'가 구축될 수 있다는 자신감이라 할 수 있다. 이를 반영하듯 이날 구글의 순다르 피차이 최고경영자는 "우리는 10년 이상 AI에 투자해 오고 있으며 이제 완전히 '제미나이 시대'에 살고 있다"고 선언하기도 했다.
이날 위해 구글은 자신들의 제품이나 기능에 담긴 공통 분모인 AI 제미나이를 지속적으로 언급했다. 생성형 AI를 탑재한 검색 엔진에서부터 'AI 어시스턴트'의 비전인 프로젝트 아스트라를 선보였다.
100개의 이메일을 단 몇 초 만에 요약하고 1시간 분량의 동영상을 한 번에 처리할 수 있는 제미나이 1.5 프로의 출시와 함께, 텍스트를 이미지로 만드는 AI인 이마젠의 최신 버전인 이마젠3, 텍스트를 입력하면 1분 이상의 영상을 만들어주는 AI 모델 비오(Veo) 등도 공개했다. 또 서버용 AI 반도체로 기존 모델보다 5배 가까운 성능의 TPU 6세대인 트릴리움도 발표했다.
특히 이날 행사에서는 올 여름 출시 예정인 구글 포토의 AI 검색 기능 시연이 가장 직관적으로 참가자들에게 다가왔다. 딸이 언제 처음 수영을 배웠는지 알려달라고 하자, 저장된 사진 가운데 딸의 수영 사진을 추려 시간순으로 요약 정리를 해준다거나 차량 번호판을 질문하자 역시 저장된 차량 사진 가운데 가장 많이 찍힌 것을 이용자 차량으로 추론해 번호판을 확대해 보여주는 등 구글 제품과 접목돼 업그레드 된 AI 추론 능력을 보여줬다.
또 구글 딥마인드의 데미스 허사비스 CEO가 처음으로 무대에 선 것도 상징적이었다. 딥마인드는 지난 2016년 바둑기사 이세돌과의 대국으로 유명한 AI 바둑 프로그램 '알파고'를 만든 회사로, 당시 전세계에 AI의 발전에 대한 일종의 센세이션을 불러일으킨 바 있다. 허사비스 CEO는 구글의 핵심 AI 조직인 딥마인드의 창업자이자 여전히 이를 이끌고 있으며, 이날 프로젝트 아스트라 등을 발표하기도 했다.
남정석 기자 bluesky@sportschosun.com
Copyright © 스포츠조선. 무단전재 및 재배포 금지.