MS, 피지컬 AI 경쟁 참전…로보틱스 모델 '로-알파' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
마이크로소프트(MS)가 피지컬 인공지능(AI) 경쟁에 참전한다.
MS 리서치는 자사 AI 모델 '파이' 시리즈 모델을 활용한 시각언어행동(VLA) 모델을 기반으로 자사 첫 번째 로보틱스 모델 '로-알파'(Rho-alpha, ρα)를 개발했다고 21일(현지시간) 밝혔다.
애슐리 로렌스 MS 리서치 액셀러레이터 부사장은 "피지컬 AI가 로보틱스를 재정의하고 있다"며 "로봇이 복잡하고 예측 불가능한 환경에서 인지·추론·행동할 수 있도록 지원한다"고 했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
![마이크로소프트(MS)의 첫 로보틱스 모델 '로-알파'가 탑재된 중국 유니트리 G1 휴머노이드 로봇. [사진=마이크로소프트 공식 홈페이지 영상 캡처]](https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/22/etimesi/20260122193943969xpjg.png)
마이크로소프트(MS)가 피지컬 인공지능(AI) 경쟁에 참전한다.
MS 리서치는 자사 AI 모델 '파이' 시리즈 모델을 활용한 시각언어행동(VLA) 모델을 기반으로 자사 첫 번째 로보틱스 모델 '로-알파'(Rho-alpha, ρα)를 개발했다고 21일(현지시간) 밝혔다.
로-알파는 자연어 명령을 통해 로봇이 '양손 조작'을 수행할 수 있도록 신호를 변환한다. 예컨대 “빨간색 전선을 당겨 빼세요” ““위쪽 스위치를 켜세요”와 같은 명령어를 이해하고 행동으로 옮긴다. 시각 정보를 인식해 행동으로 옮기는 VLA 모델을 활용했다.
MS는 인지·학습 모달리티의 기존 VLA 모델을 넘어 '촉각 센싱'을 새롭게 접목했다. MS는 이를 VLA+로 명명했다. 시각 외 새로운 감각을 깨친 것으로, 더욱 정교한 행동 제어가 가능할 것으로 기대된다. MS는 힘(force) 등 추가적인 센싱 모달리티 확장을 위한 기술 고도화를 하고 있다.

로-알파의 촉각 인지 행동 기술은 실제 로봇의 궤적 데이터와 시뮬레이션 작업, 웹 규모 시각 질의응답 데이터 공동 학습으로 구현됐다. 특히 엔비디아 로봇 시뮬레이션 플랫폼 '아이작 심'을 활용해 합성 데이터를 생성, 실제 시연 데이터셋과 결합했다.
애슐리 로렌스 MS 리서치 액셀러레이터 부사장은 “피지컬 AI가 로보틱스를 재정의하고 있다”며 “로봇이 복잡하고 예측 불가능한 환경에서 인지·추론·행동할 수 있도록 지원한다”고 했다.
현대인 기자 modernman@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 중견·중소기업에 SW+HW 'AI 가전 개발 패키지' 푼다
- 파죽지세 코스피, 코리아 디스카운트 없다 '꿈의 5000' 달성
- 네이버 'C레벨 리더 강화'-카카오 'CA협의체 조정'…새해 조직개편 앞당긴다
- 자고 일어나니 뱅크시 작품이… 벽 뜯어 7억 번 여섯 형제
- 웨어비즈, AI OCR로 인천 공항 출입국 ETA 및 EAC 여권인식 프로젝트 '성공' 완료
- '중기 기술탈취 범정부 대응단' 출범…공정위·경찰청·국정원까지 공조체계 구축
- 현대차 노조, 아틀라스 제동…“노사 합의 없인 1대도 안돼”
- AI기본법 궁금증 해소할 '지원데스크' 가동…“기업 지원”
- [카&테크]모베이스전자, 현대차 '모베드'에 메인보드·와이어링 공급
- 대웅제약, 하남에 시니어센터 '케어허브' 연다…예방으로 헬스케어 전략 확장