구글, 역대로 가장 강력한 AI 공개...물리문제 풀이 보여주자 "여기가 틀렸군요"

이서희 2023. 12. 7. 04:31
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글, 'GPT-4 대항마' 제미나이 공개
"선천적 멀티모달"... 추론 능력 강점
구글의 생성 인공지능 챗봇 '바드' 이미지. 구글은 7일 바드의 영어 버전에 최신형 거대언어모델 '제미나이'를 결합한다고 밝혔다. AFP 연합뉴스

2016년 인공지능(AI) 알파고가 이세돌 바둑 기사를 꺾은 것은 세계를 놀라게 했다. 알파고는 무한에 가까운 경우의 수를 계산해 이기는 수를 정확히 찾아냈다. 알파고는 그러나 당시 할 줄 아는 게 바둑뿐이었다.

알파고가 7년 만에 급성장해 돌아왔다. 보고, 듣고, 말하는 것은 물론이고 복잡한 물리학 문제를 이해하고 정교하게 추론하는 것까지 가능해졌다. 인간의 능력에 한층 가까워진 것이다.

구글이 6일(현지시간) 오픈AI의 'GPT-4'에 대적할 거대언어모델(LLM) '제미나이'(Gemini)를 공개했다. LLM은 다양한 AI 제품의 기반이 되는 것으로, 자동차로 치면 엔진에 해당한다. 처음부터 '멀티모달(시각, 청각 등 다양한 감각을 통해 정보를 주고받는 것) AI'로 제작된 제미나이는 알파고를 만든 구글 딥마인드가 개발을 주도했다.

제미나이는 세 가지 크기로 출시되는데, 가장 무겁고 강력한 '제미나이 울트라'는 "LLM 연구·개발에 널리 사용되는 학술 벤치마크(상대적인 비교를 위한 기준) 32개 중 30개에서 최신 기술의 결과를 능가한다"고 구글은 설명했다. 지금까지 나온 LLM 중 가장 강력한 모델이란 것이다.

5일(현지시간) 구글이 공개한 거대언어모델 제미나이의 이용 예시. 한 학생이 경사로에 서 있는 고양이의 속도를 구하는 문제를 손글씨로 푼 것을 보고, 제미나이가 어디가 틀렸는지 설명하고 있다. 구글 영상 캡처

알파고 후 7년... "제미나이, '현존 최고' GPT-4 능가"

구글이 공개한 각종 시험 결과를 보면 제미나이의 압도적 성능이 분명하게 확인된다. 구글은 수학, 미국 역사, 법률 등 주제 57개에 대한 지식 정확도를 측정하는 MMLU에서 제미나이 울트라가 90%의 정확도를 보였다고 밝혔다. MMLU AI의 전반적 성능을 보여주는 대표적 벤치마크다. 지금까지 최고로 평가받은 GPT-4는 86.4%였다.

구글은 제미나이가 "선천적 멀티모달"이라고 했다. GPT-4를 비롯한 LLM들이 글자로 상호작용하는 것을 먼저 익힌 다음 이미지를 인식하고 음성도 이해할 수 있도록 능력을 더해가는 것과 달리 처음부터 텍스트·이미지·오디오 등 다양한 데이터로 훈련했다는 의미다. 이는 제미나이가 상대가 두는 수를 보고 이해해야 다음 수를 둘 수 있는 알파고의 기술을 기반으로 개발됐기 때문이다. 제미나이는 특히 방대한 양의 유튜브 영상 콘텐츠를 학습한 것으로 알려져 있다.

5일 구글이 일부 언론을 대상으로 미리 공개한 시연 영상에서 제미나이는 물리학 문제를 단 몇 초 만에 풀었다. 경사로에 서 있는 고양이 그림을 보고 속도를 계산하는 문제를 손글씨로 푼 다음 이를 촬영해 제미나이에 입력시키자, 제미나이는 우선 정답인지 아닌지에 대한 답변을 내놨다. 오답인 경우엔 풀이 과정에서 어떤 부분이 잘못됐는지 짚으면서 정답을 찾아가는 과정을 단계별로 설명했다.

구글은 제미나이 3종 중 중간 크기인 '제미나이 프로'를 이날 즉시 '바드'에도 적용했다. 바드는 챗GPT의 대항마 격인 AI 챗봇으로, 누구나 공짜로 이용할 수 있다. 제미나이와 결합된 바드는 영어부터 먼저 지원되며 가까운 시일 내에 다른 언어로도 확대될 것이라고 구글은 밝혔다. 구글은 또 최신형 스마트폰 '픽셀8 프로'에서도 제미나이를 지원한다. 이렇게 되면 인터넷에 연결돼 있지 않아도 내장된 녹음기 애플리케이션(앱)으로 회의 내용을 요약할 수 있다.

구글·오픈AI 최신형 거대언어모델(LLM) 비교.

피차이 "AI, 혁신의 새로운 물결 부를 것"

최근 미국 실리콘밸리에선 구글이 지난달로 목표했던 제미나이 출시를 내년 초로 미뤘다는 소문이 돌았다. 영어 이외 언어에서 상당한 오류가 발견된 것이 연기 이유로 알려졌다. 이날 구글의 발표는 오픈AI와 경쟁할 LLM 개발에 어려움을 겪고 있다는 안팎의 우려를 우려를 불식시키기 위한 것으로 해석된다. 구글은 제미나이 3종 중 GPT-4를 능가하는 성능의 울트라는 아직 개선 작업 중이며 내년 초 출시할 예정이다.

제미나이는 구글의 자존심이 걸린 야심작이다. 올해 3월 오픈AI의 GPT-4가 공개된 후 AI 전문가 수천 명이 "GPT-4보다 강력한 AI 시스템 훈련을 최소 6개월 중단하자"는 서한을 냈지만, 제미나이의 출현을 막지는 못했다. 지난해 11월 챗GPT 출시 후 오픈AI보다 성능이 뛰어난 제품을 내놓는 건 사실상 처음으로, 업계에선 이제부터가 AI 시장 주도권을 둘러싼 진짜경쟁의 시작이 될 것이란 평가가 나온다.

소비자들이 체감할 수 있는 AI 서비스 경쟁도 더 치열해질 전망이다. 구글은 제미나이를 검색, 크롬(웹 브라우저) 등에도 순차 적용할 예정이다. 순다르 피차이 구글 최고경영자(CEO)는 "AI의 전환은 모바일보다도 훨씬 더 큰, 우리 생애 가장 심오한 전환이 될 것"이라며 "지금까지는 볼 수 없었던 규모로 창의성과 생산성을 촉진하고, 혁신과 경제 발전의 새로운 물결을 불러올 것"이라고 했다.

실리콘밸리= 이서희 특파원 shlee@hankookilbo.com

Copyright © 한국일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?