숭실대 권민혜 교수팀, 동물의 의사결정방법에 기반한 심층강화학습 기법 제시
숭실대 IT대학 전자정보공학부 권민혜 교수팀이 세계적으로 저명한 AI 컨퍼런스인 NeurIPS(Neural Information Processing System, 신경정보처리시스템학회)에서 동물의 의사결정 방법에 기반한 심층강화학습(deep reinforcement learning) 연구 결과를 다가오는 12월에 발표한다.
코로나19 팬데믹으로 인해 12월 6일부터 12일까지 온라인으로 개최되는 NeurIPS는 머신러닝과 빅데이터, 신경과학 등 다양한 인공지능 분야의 연구 결과가 발표되는 학회로, 권 교수팀은 ‘Inverse Rational Control with Partially Observable Continuous Nonlinear Dynamics’라는 제목으로 발표한다.
알파고로 국내에 유명해진 심층강화학습 연구가 주로 진행되는 비디오게임 환경에서는 환경 상태정보를 학습자가 직접적으로 얻을 수 있다. 그러나 대다수의 AI시스템에서는 전체 상태정보를 실시간으로 얻는 것이 현실적으로 어렵기에, 현재의 심층강화학습기술을 자율주행자동차나, 다중로봇시스템과 같은 공학시스템에 적용하는데 어려움이 많았다.
이러한 문제를 해결하기 위하여 권교수팀은 동물의 두뇌에서 수행되는 의사결정과정에서 답을 찾았다. 인간을 포함한 동물들이 의사결정을 할 때, 자신의 주변 환경에 대한 모든 상태정보를 알지 못하기 때문에 부분 관측정보만을 바탕으로 추론의 과정을 거처 의사결정이 이루어진다. 이러한 두뇌의 원리를 모방하여 ‘Bayesian optimal control ensemble’ 기법을 제안하였고, 이를 통해 부분관측만 가능한 시스템에서도 심층강화학습 사용을 가능하게 하였다.
권교수는 “세계 최고의 AI 연구결과만 발표한다는 NeurIPS에서 이번 연구가 발표되게 되어 매우 기쁘다. 이번 연구결과가 다양한 공학시스템에 심층강화학습이 널리 사용할 수 있게 되는 연결고리가 되었으면 한다”며 소감을 전했다.
한편, 권교수팀은 미국 라이스 대학교(Rice University), 베일러 의과대학(Baylor College of Medicine), 미네소타 주립대학(University of Minnesota Twin Cities), 구글(Google) 연구진과 국제협업을 통해 본 연구를 진행하였다.
온라인 중앙일보
Copyright © 중앙일보. 무단전재 및 재배포 금지.
- "팔이 거위알만해졌다" 화이자·모더나 백신 부작용 경고
- 이제는 '인간쓰레기' 말까지 들은 폼페이오...중국이 그를 미워하는 이유는
- "먹고 살기 힘들어 날 팝니다"···또 당근마켓 올라온 23세 여성 글
- [영상] "목받침 빼내 차 창문 깨라" 급류 속 부자 살린 소방관
- CCTV부터 가리고 톱질했다...전두환 동상 목 훼손 사건 전말
- 건보로 첩약 38만원→7만원…'반값한약' 적용 질환 3가지
- 미쉐린이 찍은 2021년 서울 맛집 32곳...1스타 식당들 공통점은
- 18년 만에 시집 낸 원태연 “예전의 내가 지금은 창피하다”
- 김해 신공항에 "진정한 신의 한수"라던 국토부, 검증위에 무릎 꿇었다
- 추미애의 '법무부 꽃길', 윤석열 화환에 반격? "절대 지지 않는다