구글, 차세대 LLM '제미나이' 공개…"오픈 AI GPT-4보다 뛰어나다"

구글이 수학 문제를 풀고 고도의 추론 능력을 갖춘 차세대 대규모언어모델(LLM) 기반 인공지능(AI) ‘제미나이’(Gemini)를 공개했다. 구글은 제미나이가 오픈AI의 최신 모델인 GPT-4보다 강력한 것은 물론이며 지금까지 나온 AI 모델 중 가장 뛰어난 성능을 갖췄다고 밝혔다.

6일(이하 현지시간) 구글은 온라인 행사를 통해 제미나이를 출시를 알렸다. 구글이 바드를 처음 선보인 지 8개월 만이다. 제미나이는 멀티모달 기능을 갖춰서 텍스트는 물론이며 이미지, 영상, 음성을 인식, 이해하고 추론할 수 있다. 제미나이 개발은 구글의 AI 사업부인 딥마인드가 주도했다.

구글은 다른 멀티모달 모델의 경우 텍스트, 이미지, 영상 등에 대한 학습을 개별 모델을 통해 훈련한 후 하나의 모델로 묶지만 제미나이는 개발 단계부터 다양한 모달리티에 대한 사전 학습이 동시에 진행됐다고 밝혔다. 그 결과 제미나이가 다른 모델에 비해 멀티모달 데이터를 더욱 잘 이해하고 뛰어난 성능을 보인다는 설명이다.

순다르 피차이 구글 최고경영자(CEO)는 “제미나이는 처음부터 멀티모달로 구축돼서 텍스트, 코드, 오디오, 이미지, 영상을 포함한 다양한 유형의 정보를 일반화하고 원활하게 이해해 다양한 정보에 걸쳐 작동하고 결합할 수 있다”고 밝혔다. 데미스 하사비스 딥마인드 CEO는 제미나이가 구글의 “가장 강력하고 일반적인 모델”이라고 전했다.

이날 구글이 공개한 시연 영상에서도 제미나이의 사물 인식과 판단력을 확인할 수 있다. 제미나이는 파란색 오리와 고무로 된 파란색 오리 장난감을 구별했다. 또 루프(loop)가 없는 롤러코스터와 루프가 있는 롤러코스터 그림을 보여준 후 어떤 것이 더 재미있을 것 같냐고 묻자 루프가 있는 롤러코스터라고 답했다.

제미나이는 수학 문제도 인식해서 직접 풀 수 있다. 또한 오류가 발생하면 이를 잡아내 왜 틀렸는지 설명하고 올바른 수식을 내놓을 수 있다. 제미나이는 개발자들이 많이 사용하는 파이썬, 자바, C++, C 등의 프로그래밍 언어들을 이해해서 코딩에 있어서도 뛰어난 성능을 갖추고 있다.

제미나이는 규모가 가장 크고 강력한 울트라, 광범위한 작업에 걸쳐 사용이 가능한 프로와 특정 작업과 모바일 장치에서 사용이 가능한 나노, 총 3개의 모델로 출시됐다.

구글은 데이터센터용인 제미나이 울트라가 고도로 복잡한 작업을 수행할 수 있으며 현존하는 LLM 중 가장 뛰어난 성능을 갖췄다고 설명했다. 울트라는 수학, 경제, 물리학, 역사, 법률, 의학 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대규모 다중작업 언어 이해(MMLU) 테스트에서 90%의 응답률을 받았다. 이는 지금까지 AI 모델이 받은 점수 중 가장 높으며 MMLU에서 ‘전문가 수준’에 해당되는 89.8%를 능가하는 수준이다.

구글은 특히 울트라 버전이 오픈 AI의 GPT-4를 뛰어넘는다고 전했다. 구글은 내년 초에 울트라를 자사 챗봇 바드에 적용해 ‘바드 어드밴스드’(Bard Advanced)를 선보인다는 계획이다.

제미나이 프로의 경우 테스트에서 오픈AI의 구형 모델인 GPT-3.5보다 우수한 성적을 기록했다. 프로는 바드 영어 버전에 적용된다. 구글은 제미나이 탑재로 바드의 “이해, 요약, 추론, 코딩 및 계획” 기능이 더욱 개선될 것이라고 설명했다.

제미나이 나노는 지난 10월 공개된 구글 픽셀 8 프로에 탑재돼서 녹음기 앱을 통해 녹취한 내용을 이해하고 이에 대한 요약본 제공 등의 기능을 갖추게 된다.

구글은 제미나이를 생성형 AI 검색 서비스인 SGE(Search Generative Experience)에 테스트 중이며 제미나이를 적용한 결과 영어 버전 앱에서 대기 시간이 40% 줄었다고 밝혔다. 구글은 향후 몇 달에 걸쳐 검색, 크롬, 광고, 생성형 AI 보안 솔루션 ‘듀엣 AI’에 적용한다.

구글은 오는 13일부터 개발자와 기업 고객들에게 구글 AI 스튜디오와 구글 클라우드 버텍스 AI를 통해 제미나이 API 제공한다. 안드로이드 개발자들은 제미나이 나노를 활용해 앱과 서비스 등을 구축할 수 있다.