‘피지컬 AI’ 로봇, 제조·물류 등 상용화 눈앞

권기백 기자 2026. 2. 22. 14:14
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

‘CES 계기’ 현장 투입 논의 확산
적용 확대…안전·신뢰성 과제도
파운데이션 모델과 VLA 모델을 포함하는 피지컬 AI 시스템 실행 예시 인포그래픽. 정보통신기획평가원 보고서

파운데이션 모델과 VLA(Vision-Language-Action) 모델의 결합을 기반으로 한 ‘피지컬 AI(Physical AI, 인공지능)’가 로봇 지능의 핵심 기술로 부상하고 있다. 피지컬 AI가 환경 인지와 추론, 계획, 행동 제어를 폐루프로 통합한 지능형 에이전트로, 로봇의 실제 현장 적용을 가능하게 하고 있다는 분석이다.

22일 정보통신기획평가원(IITP)에 따르면 피지컬 AI는 단순히 로봇에 인공지능 기능을 추가하는 수준을 넘어, 물리적 세계에서 스스로 판단하고 행동하는 지능형 시스템을 의미한다. 센서를 통해 환경을 인식하고, 목표에 따라 추론과 계획을 수행한 뒤, 이를 실제 동작으로 실행하는 전 과정이 하나의 폐루프 구조로 연결되는 것이 특징이다.

최근 CES 2026을 계기로 휴머노이드와 산업용 로봇이 실제 현장 투입을 전제로 공개되면서, 로봇 기술의 경쟁 축이 하드웨어에서 소프트웨어 기반 지능으로 이동하고 있다는 평가가 나온다. 특히 제조·물류·서비스 분야에서 로봇의 자율성과 범용성이 중요해지면서 피지컬 AI 기술의 필요성이 커지고 있다.

보고서는 이러한 변화의 핵심으로 파운데이션 모델과 VLA 모델의 결합을 지목했다. 파운데이션 모델은 대규모 멀티모달 데이터를 기반으로 상식적 추론과 물리 세계 예측 능력을 제공하는 역할을 맡는다. 반면 VLA 모델은 시각 정보와 언어 지시를 통합해 로봇의 실제 행동을 생성하는 정책 모델로, 센서와 액추에이터에 직접 연결돼 실행을 담당한다.

이 두 기술이 결합되면서 로봇은 단순 반복 작업을 수행하는 자동화 장비를 넘어, 상황을 이해하고 목표를 설정한 뒤 다단계 작업을 스스로 수행할 수 있는 범용 지능으로 진화하고 있다는 분석이다. 이는 기존 과제별 제어기 중심의 로보틱스 접근 방식과 구별되는 지점이다.

다만 보고서는 피지컬 AI의 본격적인 확산을 위해서는 안전성과 신뢰성 확보, 시뮬레이션과 현실 간 격차 해소, 지속 학습 체계 구축 등 해결해야 할 과제도 적지 않다고 지적했다. 그럼에도 파운데이션 모델과 VLA 기술을 중심으로 한 피지컬 AI는 로봇이 연구 단계를 넘어 산업과 일상 공간으로 확산되는 전환점이 될 것으로 전망됐다.

한 AI 전문가는 “그동안 로봇은 정해진 환경에서 반복 작업을 수행하는 자동화 장비에 가까웠다면, 피지컬 AI는 로봇이 상황을 이해하고 스스로 판단해 행동하는 단계로 나아가는 기술적 기반”이라며 “파운데이션 모델의 추론 능력과 VLA의 실행 역량이 결합되면서 범용 로봇 지능의 상용화 시점이 앞당겨질 가능성이 크다”고 말했다.

권기백 기자 baeking@viva100.com