"실험실 떠나 가정으로"…딥마인드, 로봇 맞춤 AI 모델 '제미나이 로보틱스' 공개

조회 392025. 3. 13.
(사진=구글 딥마인드)

집안 곳곳을 누비며 집안일을 수행하는 휴머노이드 로봇이 각 가정에 투입될 날이 머지 않았다. 다양한 환경에서도 능숙한 작업이 가능해지고 있기 때문이다.

구글 딥마인드는 12일(현지시간) 로봇공학을 위해 설계된 제미나이 2.0 기반 모델인 '제미나이 로보틱스(Gemini Robotics)'를 공개했다.

그간 추론 모델이 속속 출시되며 수학, 코딩 등 복잡한 문제를 해결하는 AI의 능력이 크게 진전됐다.

물리적 영역에서도 AI가 사람들에게 도움을 주기 위해서는 결국 로봇이 현실 세계를 이해하고 즉각 반응할 수 있는 '두뇌'를 갖춰야 했다.

이를 위해 구글 딥마인드는 고급 시각-언어-행동(VLA) 모델 '제미나이 로보틱스'를 통해 로봇이 광범위한 작업을 수행할 수 있게 됐다고 밝혔다.

딥마인드는 ▲상황 적응력 ▲상호 작용 ▲다재다능한 손재주 등에 주안점을 두고 로봇용 AI 모델을 개발했다. 그 결과 제미나이 로보틱스는 다른 VLA 모델과 비교해 특정 벤치마크에서 성능이 두 배 이상 향상됐다고 한다.

제미나이 로보틱스를 활용하면 로봇이 직관적으로 상호 작용을 할 수 있다. 제미나이의 고급 언어, 이해 기능을 활용해 일상 대화 언어로도 명령을 이해하고 응답할 수 있다.

또한 제미나이 로보틱스는 종이 접기나 봉투에 간식을 넣는 것과 같은 정밀한 조작도 가능케 한다. 예를 들어 물건이 손에서 미끄러지거나, 누군가가 물건을 옮겨도 재빨리 스스로 계획을 세우고 작업을 계속 진행할 수 있다.

이 같은 능력은 현실 세계에서 로봇에게 꼭 필요한 능력이라는 설명이다. 로봇의 모양과 크기가 다양하기 때문에 제미나이 로보틱스는 다양한 로봇 유형에 쉽게 적응하도록 설계됐다.

(사진=구글 딥마인드)
(사진=구글 딥마인드)

이날 공개된 제미나이 로보틱스-ER 모델은 제미나이 2.0의 기존 기능인 포인팅 및 3D 감지 기능이 크게 개선됐다. 공간 추론이 강화돼 즉석에서 상황에 대처하는 능력을 향상시킨다.

예를 들어, 커피 머그잔을 보여주면 모델은 손잡이를 잡고 들어올리는 데 적합한 두 손가락 잡기와 머그잔에 접근하는 데 안전한 궤적을 직감할 수 있다.코드 생성만으로는 충분하지 않은 경우 제미나이 로보틱스-ER은 인간의 행동에 따라 솔루션을 제공하는 '학습의 힘'을 활용할 수도 있다.

구글 딥마인드의 수석 이사이자 로봇 책임자인 캐롤라이나 파라다는 "우리는 모델의 역량을 탐구하고 실제 세계 응용 프로그램으로 가는 길에서 이를 계속 개발하기를 기대한다"라고 밝혔다.

구글은 앱트로닉과 같은 로봇 회사와 협력해 '차세대 휴머노이드 로봇'을 구축 중이다. 제미나이 로보틱스-ER 모델은 애자일 로봇, 어질리티 로보틱스, 보스턴 다이내믹스 등을 포함한 파트너사들이 먼저 활용할 수 있다.

AI포스트(AIPOST) 유진 기자

■ 보도자료 및 광고, 비즈니스 협업 문의 aipostkorea@naver.com

Copyright © AI포스트(AIPOST)

이 콘텐츠가 마음에 드셨다면?
이런 콘텐츠는 어때요?

최근에 본 콘텐츠와 구독한
채널을 분석하여 관련있는
콘텐츠를 추천합니다.

더 많은 콘텐츠를 보려면?

채널탭에서 더 풍성하고 다양하게 추천드려요