국산 로봇 두뇌, 엔비디아 턱밑 추격…NC AI 모델 성능 80%

최지원 기자 2026. 3. 16. 15:04
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

구글, 엔비디아 등 글로벌 정보기술(IT) 기업이 이끄는 피지컬 인공지능(AI) 분야에서 한국 토종 AI 모델이 유의미한 성과를 냈다.

16일 NC AI는 자체 개발한 '월드 파운데이션 모델(WFM)'이 고난도 로봇 조작 태스크에서 글로벌 최고 성능 모델 대비 80% 수준의 성공률을 달성했다고 밝혔다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

NC AI가 16일 로봇 지능의 핵심인 ‘월드 파운데이션 모델을 성공적으로 시연하며 글로벌 피지컬 AI 시장에 강력한 도전장을 던졌다. NC AI의 WFM이 예측한 영상(왼쪽)과 로봇이 시뮬레이터에서 실제로 움직인 영상(오른쪽). (사진=NC AI 제공)
구글, 엔비디아 등 글로벌 정보기술(IT) 기업이 이끄는 피지컬 인공지능(AI) 분야에서 한국 토종 AI 모델이 유의미한 성과를 냈다.

16일 NC AI는 자체 개발한 ‘월드 파운데이션 모델(WFM)’이 고난도 로봇 조작 태스크에서 글로벌 최고 성능 모델 대비 80% 수준의 성공률을 달성했다고 밝혔다. WFM은 로봇 지능의 핵심으로, 최근 많은 글로벌 빅테크들이 천문학적인 자본을 투입하고 있는 분야다. 그럼에도 로봇이 학습한 정보와 현실 사이의 ‘시뮬레이션-현실(Sim2Real)’ 격차는 해결하지 못한 과제로 남아있다.

보통 WFM은 영상을 생성하고 이를 ‘비전언어모델(VLM)’으로 추론을 한 뒤에 취해야 할 행동을 선택한다. NC AI는 과감하게 영상을 생성하고 추론하는 단계를 제거하고, 영상을 생성하기 전 신경망 정보(잠재공간 정보)에서 바로 행동을 도출하는 방식을 택했다. 연산이 많이 필요한 작업을 제거해 효율성은 높이고, 영상을 생성할 때 발생할 수 있는 ‘할루시네이션(환각)’을 방지함으로써 정확성은 높였다는 설명이다. 실제 이번 연구 성과는 글로벌 최고 성능 모델의 파인튜닝(미세 조정)에 필요한 그래픽처리장치(GPU) 자원의 25% 만으로 달성됐다.

NC AI 관계자는 “여기에 고정밀 물리 엔진 데이터를 집중적으로 학습시켜 정확도를 높였다”며 “예쁜 그림을 배운 게 아니라 ‘정확한 물리 법칙’을 수학적으로 이해하고 행동을 계산하는 것”이라고 설명했다.

회사는 로봇 팔의 복잡한 움직임을 제어하는 24개의 고난도 로봇 조작 태스크로 시험한 결과, 자체 개발한 WFM이 엔비디아의 WFM ‘코스모스’ 등 최고 성능 모델 대비 70% 성능을 확보했다. 현장 투입 및 상용화와 직결되는 18개 핵심 과제에 대해서는 80%에 해당하는 성능을 보였다.

최지원 기자 jwchoi@donga.com

Copyright © 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지