구글 CEO가 "가장 큰 결과물" 만족한 야심작[뒷북글로벌]

실리콘밸리=윤민혁 기자 2023. 12. 7. 07:30
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

최신 AI ‘제미나이’ 공개···MS·오픈AI 연합에 반격
강력한 시야 인식, GPT4 터보 압도
과학적 지식에 영상·음악까지 학습
완전체 ‘울트라’ 버전 내년 초 출시
[서울경제]
“구글의 가장 큰 과학·공학적 결과물”

“지금까지 구글이 수행한 가장 큰 결과물이다.”

순다르 피차이 구글 CEO가 자부심을 갖고 극찬한 주인공은 5일(현지시간) 깜짝 공개된 최신 인공지능(AI) ‘제미나이(Gemini)’다. 당초 구글은 올 11월 제미나이를 출시할 예정이었으나 성능과 안정성 제고를 이유로 일정을 내년으로 미룬 상태였다. 경쟁 기업인 오픈AI가 GPT-4 터보를 내놓은 지 한 달도 채 되지 않은 시점에 더 발전된 AI를 구글이 선보이면서 이날 공개는 더욱 주목받았다. 샘 올트먼 최고경영자(CEO) 축출과 복귀 사태로 오픈AI의 발목이 잡힌 가운데 그간 AI에서 한 발 뒤처졌다는 평가를 받아온 구글이 본격적인 반격에 나섰다는 분석도 나온다.

순다르 피차이 구글 CEO/AP연합뉴스

구글과 딥마인드는 이날 온라인 브리핑을 통해 ‘제미나이 1.0’을 공개했다. 브리핑에서 소개된 제미나이는 초거대 인공지능 AI 후발 주자라는 오명과 한 차례의 출시 연기에 대한 아쉬움을 지울 만큼 뛰어난 성능을 자랑한다. 주요 AI 성능 평가(벤치마크) 32개 항목 중 30개에서 경쟁사인 오픈AI의 GPT-4를 앞선다. GPT-4 터보처럼 이미지·영상·음성 처리가 가능한 ‘멀티모달 AI’임은 물론 파일로만 인식이 가능한 GPT-4 터보와 달리 강력한 비전(시야) 인식을 갖춰 마치 눈이 달린 사람과 실시간으로 대화하듯 사용할 수 있다.

출시 연기 아쉬움 압도 뛰어난 성능

일각에서 ‘오픈AI의 GPT-4 터보에 긴장한 구글이 출시를 미뤘다’는 소문도 돌았으나 구글은 이를 압도하는 실시간 시야 인식 능력을 선보이며 기다림이 헛되지 않았음을 입증했다. 구글은 스마트폰 ‘픽셀’부터 검색·e메일·드라이브·독스 등 모든 서비스에 제미나이를 적용해 AI 선두 주자인 오픈AI와 마이크로소프트(MS)를 제치겠다는 각오다.

제미나이는 초거대 AI 성능 테스트인 MMLU(초거대 다중 업무 언어 이해)에서 최고 성능 모델인 울트라 기준 90%를 기록했다. 오픈AI의 GPT-4가 기록한 86.4%를 뛰어넘는 역대 최고 점수다. 오픈AI가 GPT-4 터보에 적용한 멀티모달(사진·영상·음성) 지표도 압도적으로, 대부분 성능 측정(벤치마크)에서 GPT-4를 뛰어넘는다. 제미나이는 GPT-4 터보에서 찾아볼 수 없던 실시간 시야 인식 능력도 갖췄다. 현재 공개된 GPT-4 터보의 멀티모달 기능은 이미지나 영상 파일을 GPT-4에 넣어 인식시키는 방식이다. 반면 제미나이는 AI가 카메라로 실제 사람의 행동을 보며 이에 대응해 소통한다.

오리 그림에 파란색 칠했더니···

단순히 사물을 인식하는 수준이 아니다. 종이에 펜으로 오리를 그리면 제미나이가 ‘새’임을 알고, 오리 옆에 물결 표시를 그리면 ‘오리’임을 파악한다. 오리의 몸을 파란색으로 칠하면 “흔치 않은 종(種)이지만 파란 오리도 있다”며 파란색 종에 대해 소개하고 파란색 목욕 장난감 오리를 보여주면 “실제 오리가 아니라 장난감 오리를 그렸구나”라고 답한다. 이 장난감이 물에 뜰지 물어보면 당장은 답하지 못하지만 손으로 찌그러뜨리는 모습을 보여주면 “플라스틱이고 속이 비어 있어 물에 뜨겠다”는 답을 내놓는다.

수학과 물리학에 대한 인식은 한층 정교화됐다. 네모난 모양의 차량과 앞면이 삼각형인 차량을 그린 뒤 어느 쪽이 더 빠를지 질문하자 “공기역학이 적용된 세모난 차가 더 빠르다”는 답을 내놓았다. 그래프가 그려진 수학 문제와 오답을 낸 풀이 과정을 보여주면 어떤 부분에서 틀렸는지 지적하고 올바른 수식도 내놓는다.

유튜브 영상과 음악도 학습했다. ‘매트릭스’ 주인공이 총알을 피하는 장면을 사람이 따라하자 “영화 ‘매트릭스’의 유명한 장면”이라고 답했다. 기타를 그리면 기타로만 연주한 음악을, 드럼과 베이스를 그리면 밴드 음악을 연주한다. 사물 인식과 판단력이 사람과 다를 바가 없다.

미니·프로·울트라 3개 모델

구글은 제미나이를 매개변수(패러미터) 규모에 따라 세 가지 모델로 분류했다. 이날 구글이 시연한 제미나이는 완전체인 ‘울트라’ 버전으로 내년 초 출시한다. 영어 외 타 언어 지원 미흡으로 출시가 연기됐다는 소문이 있었으나 엘리 콜린스 구글 딥마인드 프로덕트 부사장은 “100개 이상 언어를 지원하고, 울트라 출시 연기는 안전성을 보다 확실히 하기 위함”이라며 일축했다. 제미나이는 한글을 포함한 100개 이상의 언어를 지원한다.

개발자와 기업용인 프로는 올해 5월 선보인 구글 AI 도우미 바드에 즉각 적용돼 각종 구글 서비스에서 활용 가능하다. 다음 달부터는 검색과 광고, 크롬 브라우저까지 영역을 넓힌다. 구글은 “제미나이 적용으로 내부 테스트상 검색 소요 시간이 40% 줄었다”고 밝혔다. 개인용인 나노는 6일부터 일반 사용이 가능하다. 구글 TPU(텐서연산유닛)를 탑재한 스마트폰 픽셀8 프로에서는 인터넷·통신 연결 없이도 제미나이를 쓸 수 있다.

이는 제미나이가 TPU로 학습된 덕이다. 이날 구글은 제미나이 학습에 사용한 TPUv5도 공개했다. 전작보다 부동소수점연산(FLOPS) 속도가 2배 빠르고 제미나이 등 차세대 AI에서는 4배 빠른 연산 처리를 자랑한다. 엔비디아 그래픽처리장치(GPU)와 이를 사용한 오픈AI에 하드웨어 부분에서도 공세를 펼치는 셈이다.

순다르 피차이 구글 CEO는 “제미나이는 구글이 개발한 가장 포괄적이고 뛰어난 AI 모델”이라며 “딥마인드를 설립할 때 가졌던 비전을 처음으로 실현한 모습이자 지금까지 구글이 수행한 가장 큰 과학·공학적 결과물”이라고 말했다.

성능 비교 넘어 서비스로 AI 전장 확대

한편, 제미나이 출시로 초대형 AI 경쟁은 더욱 격화할 것으로 전망된다. 전장은 단순 성능 비교가 아닌 최종 사용자가 접하는 서비스 분야로 넓어질 것으로 보인다. 오픈AI와 손잡은 MS는 이미 윈도우 운영체제(OS)와 엣지 브라우저에 AI 코파일럿을 적용해 선공에 나섰다. 구글은 플랫폼과 하드웨어·스마트폰에까지 제미나이를 도입해 AI의 ‘수직계열화’를 이뤄 우위를 점하겠다는 전략이다. 한발 뒤처진 메타는 전날 IBM·인텔·AMD 등 50여 개 기업과 손잡고 ‘AI 동맹’을 구축하며 반격을 시도하고 있다.

실리콘밸리=윤민혁 기자 beherenow@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?