DGIST-MIT 연구팀, 복잡한 환경 인지하는 '로봇눈' 경연서 세계 1위

대구경북과학기술원(DGIST)과 미국 매사추세츠공대(MIT) 공동연구팀이 불규칙하고 복잡한 야외 환경에서도 안정적으로 물체를 인식할 수 있는 인공지능(AI) 기반 시각 기술을 개발해 국제 경연대회에서 1위를 차지했다.
DGIST는 윤성훈 전기전자컴퓨터공학과 교수와 임형태 MIT 박사후연구원 공동연구팀이 '국제 로봇공학 및 자동화 학술대회(ICRA) 2026'의 필드 로봇 워크숍에서 주최한 'GOOSE 2D 시맨틱 분할 챌린지'에서 전세계 56개 팀을 제치고 1위를 기록했다고 9일 밝혔다.
이번 대회는 야외에서 작동하는 필드 로봇이 실제 환경에서 마주하는 복잡한 장면을 얼마나 정확하게 이해하는지 평가한다. 잘 정돈된 도로 중심으로 수집된 자율주행 데이터셋과 달리 대회에서 제공된 'GOOSE 데이터셋'은 예측 불가능한 환경에서 수집된 필드 로봇 중심의 데이터다.
GOOSE 데이터셋은 독일 연구진이 만든 데이터셋으로 굴삭기, 4족 보행 로봇 등이 숲길이나 비포장도로 등에서 수집한 센서 데이터가 포함된다. 올해 대회는 세부 평가항목이 64개로 확대되고 출현 빈도가 매우 낮은 희소 물체까지 정확하게 인식하는 능력이 요구됐다.
연구팀은 미국 메타(Meta)의 최신 시각 인지 모델인 'DINOv3'와 장면 속 물체를 분리해 해석하는 분할 모델 'Mask2Former'를 결합해 새로운 시각 프레임워크를 개발했다. 광량 변화나 불규칙한 지형, 복잡한 배경 등 실제 환경에서 발생하는 변수 속에서도 시각 인식 성능을 안정적으로 발휘했다.
관련 데이터가 부족해 AI가 놓치기 쉬운 희소 물체 판별 성능을 극대화해 사고로 이어질 수 있는 치명적 인식 실패를 대폭 줄였다.
이번 성과는 물리 환경과 상호작용하는 '피지컬 AI' 구현을 위한 기반 기술로 향후 자율주행차량뿐 아니라 재난 대응, 스마트 농업, 건설 현장 등 다양한 필드 로봇 산업 분야까지 확장 가능할 것으로 기대된다.
윤 교수는 "예측 불가능한 비정형 야외 환경에서 장면을 정밀하게 이해하는 기술은 필드 로봇의 자율성과 안전성을 보장하기 위한 가장 핵심적인 기술"이라며 "글로벌 무대에서의 성과를 발판 삼아 실제 로봇 시스템 및 다양한 산업 현장에 즉각적으로 적용할 수 있는 강력한 시각 인지 기술 연구를 지속적으로 발전시켜 나가겠다"고 말했다.

[이병구 기자 2bottle9@donga.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.