숭실대, 오프라인 강화학습 기반 자율주행 기술 발표

남민주 인턴 기자 2024. 3. 13. 18:11
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

숭실대 전자정보공학부 권민혜 교수 연구팀이 로봇공학 분야 최우수학회 IEEE ICRA2024에 오프라인 강화학습 기반 자율주행 정책 학습 기술을 공개했다.

권민혜 교수 연구팀은 이러한 문제를 해결하기 위해 사전에 수집된 데이터셋을 활용하여 초기 정책을 학습하는 오프라인 강화학습에 기반한 자율주행 정책 학습 기술을 개발한 것이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

해당 기술을 사용 시 기기적 손상 없이 강화학습 실용성 보완 가능
[서울=뉴시스] (왼쪽부터) 권민혜 교수, 이동수 학생(석박통합과정), 엄찬인 학생(석사과정) (사진=숭실대 제공) *재판매 및 DB 금지


[서울=뉴시스]남민주 인턴 기자 = 숭실대 전자정보공학부 권민혜 교수 연구팀이 로봇공학 분야 최우수학회 IEEE ICRA2024에 오프라인 강화학습 기반 자율주행 정책 학습 기술을 공개했다.

인공지능에 의사결정 능력을 부여할 수 있는 기존의 강화 학습 방법론은 시행착오에 의존하며, 실시간으로 학습 데이터 수집을 병행하기 때문에 기기의 손상 및 데이터 수집 비용 등에 대한 우려가 존재했다. 이로 인해 자율주행과 같은 미션 크리티컬 기술을 위한 초기 개발 방법론으로 적용하기에는 어려움이 있었다

권민혜 교수 연구팀은 이러한 문제를 해결하기 위해 사전에 수집된 데이터셋을 활용하여 초기 정책을 학습하는 오프라인 강화학습에 기반한 자율주행 정책 학습 기술을 개발한 것이다. 해당 기술을 사용하면 기기적 손상 없이 강화학습의 실용성을 보완할 수 있다.

권 교수팀에 따르면 특히 이번에 공개된 자율주행 기술은 자율주행차가 관측 가능한 정보만으로 의사결정을 진행하는 부분 관찰 마르코프 의사결정 모델에 기반하고 있어 더욱 실용적이라고 한다. 또 카메라 이미지 기반에서 학습하는 자율주행 정책이 아닌 센서 수치 데이터 기반의 자율주행 정책 기술이라는 점과 인지-판단-제어 3단계 자율주행 기술 중 판단 기능에 최적화된 기술을 제공한다는 점에서 그 의미가 크다고 한다.

해당 기술은 이동수 석박통합 과정생이 제 1저자, 엄찬인 석사 과정생이 공저자로, 권민혜 교수가 교신저자로, ‘AD4RL: Autonomous Driving Benchmarks for Offline Reinforcement Learning with Value-based Dataset’이라는 제목으로 국제 학회인 IEEE International Conference on Robotics and Automation (ICRA)에서 5월 13일부터 17일까지 발표될 예정이다. IEEE ICRA는 자율주행 기술을 포함한 로봇공학 분야의 최우수 학회다.

☞공감언론 뉴시스 mjsouth@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?