[NDC21]창발적 게임 제작 위한 엠바크스튜디오표 로봇 훈련기
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
스웨덴에 위치한 넥슨의 자회사 엠바크스튜디오는 개발 중인 멀티플레이 협동 액션 게임에 창발적인 게임 플레이가 가능하도록 로봇의 물리 애니메이션 훈련에 매진하고 있다.
톰 솔베르그 머신러닝 엔지니어는 11일 넥슨개발자컨퍼런스에서 '로봇 훈련법'을 주제로 물리 기반 애니메이션을 제작하게 된 배경과 로봇 훈련법을 소개했다.
물리 애니메이션을 제공하기 위해 엠바크스튜디오에서는 로봇 훈련에 한창이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
톰 솔베르그 머신러닝 엔지니어는 11일 넥슨개발자컨퍼런스에서 '로봇 훈련법'을 주제로 물리 기반 애니메이션을 제작하게 된 배경과 로봇 훈련법을 소개했다.
이를 물리 기반 애니메이션으로 제작하면 지면의 수직항력, 체중 등으로 자연스러운 움직임을 이끌어 낸다. 나아가 게임 전체를 물리적으로 '믿을 만하게' 만들면, 유저가 오픈 샌드박스 내에서 자신들의 경험을 결정하고 창조할 수 있을 것이라 기대했다.
예를 들어 불타고 있는 보스를 보면 유저는 화염을 막아주는 마법과 함께 지면에 있는 불을 피하려고 한다. 근처에 물이 있다면 이를 활용할 수도 있다.
로봇에게 행해진 모든 것이 물리적으로 합리적이면 로봇은 현실적인 방식으로 대응한다. 무거운 물체에 부딪힌 상태를 회복하려고 하고, 충돌에 회전하고, 들어올려지기도 하고, 신체 부분이 완전히 부서지거나 변형되는 등 여러 물리적 작용을 보인다.
이를 이끌기까지 강화 학습을 진행하고 있다. 보상과 벌을 제공해 학습될 때까지 반복하는 조건반사적 훈련이다. 관찰, 액션, 대응, 향상 등 4가지 절차를 수없이 거친다. 오르거나 뛰어오르지 않겠다고 거절하는 로봇이 생길 수도 있어 로봇이 얼마나 많은 보상을 받았는 지 어떤 임무에 대해서 보상을 받았는지를 측정에 상당 부분 시간이 필요하다.
그는 "2시간 이내 걷기 학습까지 무난히 진행되는 편이지만, 얼마나 자연스러운가, 이질감이 없는가가 '최고'보다 가장 중요하다"며 "우리는 검증에 대부분의 시간을 그저 로봇을 바라보는 데 쓴다"고 말했다. 이와 함께 시중의 훈련 도구는 포토샵이 필요한 상황에서 그림판 수준으로, 제로 수준에서 만들고 있다고 고충을 토로했다.
어려움에도 로봇을 훈련시키는 이유로 수작업으로 만들 때보다 더 많은 애니메이션에 물리적 디자인을 연결할 수 있고 새로운 규칙을 로봇이 학습한다는 점을 꼽았다. 예를 들어 고릴라 외형을 지닌 로봇은 고릴라처럼 걷고 물리학 시뮬레이션에 날개를 추가하면 나는 법을 배운 새처럼 움직인다.
[게임&게이머, 문화를 전합니다. 포모스게임│무단 전재 및 재배포 금지]
Copyright © 포모스. 무단전재 및 재배포 금지.