“안에 사람 숨어있는 거 아냐?”…2026년 출시한다는 ‘가슴달린 로봇’

원호섭 기자(wonc@mk.co.kr) 2025. 12. 24. 06:09
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

‘휴머노이드 서밋’ 등장한 美구글·中샤오펑
구글은 제미나이 결합한 지능형 SW 플랫폼
샤오펑은 인간 닮은 하드웨어 개발에 무게
샤오펑의 아이언 휴머노이드 로봇이 무대를 걷는 모습. [SNS]
지난 12일 미국 실리콘밸리 마운틴뷰에 있는 컴퓨터역사박물관에서 열린 ‘휴머노이드 서밋’에서 전 세계 로봇 산업을 이끄는 두 기업, 미국 구글과 중국 샤오펑이 각기 다른 전략을 들고 무대에 섰다. 캐롤라이나 파라다 구글 딥마인드 로보틱스 총괄과 야오젠 샤오펑 이사는 각각 ‘지능형 소프트웨어 플랫폼’과 ‘인간 유사 하드웨어의 통합’이라는 상반된 비전을 제시하며 휴머노이드의 미래를 그렸다.

파라다 총괄은 발표 시작부터 로봇의 ‘지능’을 강조했다. 그는 현재 로봇이 특정 작업에만 프로그래밍돼 있어 환경에 대한 수많은 가정을 전제로 새로운 애플리케이션 배포에 수개월이 걸리는 한계를 지적했다. 구글의 목표는 물리적 세계의 지능을 해결해 로봇이 어떠한 환경에서도 일반적인 작업을 수행할 수 있도록 만드는 것이다.

구글 전략의 핵심은 인공지능(AI) 파운데이션 모델인 ‘제미나이 1.5’를 로보틱스에 접목하는 것이다. 파라다 총괄은 이를 통해 로봇이 시각·언어·행동을 통합적으로 이해하는 ‘비전 언어 행동(VLA·Visual-Language-Action)’ 모델을 구축했다고 설명했다. 특히 주목할 점은 ‘교차 신체 학습’이다. 구글은 휴머노이드, 4족 보행 로봇, 양팔 로봇 등 다양한 형태의 로봇 데이터를 하나의 모델로 학습시켜 특정 로봇이 경험하지 못한 동작까지 수행할 수 있는 일반화 능력을 보여줬다.

실제로 시연 영상에서 로봇은 농구공을 처음 봤음에도 “농구공을 집어 슬램덩크를 하라”는 명령을 이해하고 200밀리초(㎳) 만에 판단을 내려 행동으로 옮겼다. 또 샌프란시스코의 쓰레기 분리수거 규정을 검색해 물건을 분류하거나 세탁물을 정리하는 등 복잡한 다단계 추론이 필요한 작업도 수행했다.

구글은 안전 문제에도 깊이 관여하고 있다. 단순히 물리적 충돌을 방지하는 것을 넘어 ‘시맨틱 물리적 안전’ 개념을 도입했다. 예를 들어 로봇에 물 한 잔을 가져다 달라고 했을 때 테이블 모서리에 컵을 놓지 않는 것과 같은 상식적인 안전을 의미한다. 구글은 직접 하드웨어를 대량 생산하기보다는 강력한 지능형 레이어를 구축해 다양한 로봇 생태계에 ‘두뇌’를 제공하는 플랫폼 전략을 취하고 있다.

지난 12일 실리콘밸리 마운틴뷰에 있는 컴퓨터역사박물관에서 열린 ‘휴머노이드 서밋’에서 캐롤라이나 파라다 구글 딥마인드 로보틱스 총괄이 발표하고 있다.
야오 이사는 자사의 로봇 ‘아이언’을 소개하며 “가장 인간과 유사한 로봇”을 만드는 것이 목표라고 밝혔다. 샤오펑이 정의하는 휴머노이드는 외형뿐만 아니라 움직임, 소통 그리고 행동 방식까지 모든 차원에서 인간을 닮아야 한다.

샤오펑의 접근 방식은 하드웨어와 소프트웨어의 긴밀한 ‘공동 설계’에 있다. 야오 이사는 로봇의 배터리 수명, 발열 관리, 실시간 처리 속도 등을 고려했을 때 단순히 거대언어모델(LLM)을 로봇에 이식하는 것만으론 한계가 있다고 지적했다. 따라서 샤오펑은 모델 아키텍처와 추론 엔진을 하드웨어 특성에 맞춰 처음부터 함께 설계해 온디바이스 환경에서 효율적으로 작동하도록 최적화했다.

샤오펑의 아키텍처는 뇌 역할을 하는 ‘VLT(Vision-Language-Time·Task)’와 척수 역할을 하는 ‘VLA’로 구성된다. VLT가 “부엌에서 물을 가져오라”는 고차원 명령을 내리면 VLA가 구체적인 관절 움직임을 제어하는 방식이다. 야오 이사는 내비게이션 도중 물병을 떨어뜨리는 돌발 상황에서도 로봇이 즉각적으로 계획을 수정해 다시 물병을 집어 드는 시나리오를 통해 이 시스템의 유연성을 설명했다.

허샤오펑 회장이 지난 11월 5일 광저우 샤오펑 본사에서 열린 ‘2025 인공지능(AI) 데이’ 행사에서 휴머노이드 로봇 ‘아이언’의 2세대 모델을 소개하고 있다. [AFP연합뉴스]
가장 눈길을 끈 것은 명확한 상용화 일정이었다. 야오 이사는 “2026년 말까지 대량 생산을 목표로 하고 있다”고 밝혔다. 초기에는 샤오펑의 자동차 대리점이나 공장에서 고객 응대, 부품 운반 등 업무를 수행하며 신뢰성을 검증할 계획이다.

이번 서밋에서 구글은 로봇 형태와 상관없이 적용할 수 있는 ‘범용 AI 두뇌’를 제공하겠다는 포부를 드러냈다. 제미나이 1.5를 통해 로봇이 처음 보는 물체와 환경에서도 인간 수준의 추론과 작업을 수행할 수 있음을 증명하며 소프트웨어 파워를 과시했다.

반면 샤오펑은 테슬라와 유사한 수직 통합 전략을 보여줬다. 하드웨어 제약 사항을 고려한 최적화된 AI 모델 설계와 구체적인 양산 계획을 제시하며 실제 물리적 제품으로서 휴머노이드를 완성해나가겠다는 의지다. [실리콘밸리 원호섭 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지