GIST '스타크래프트 II' 상황 1만 배 빠르게 예측하는 기술 개발

조영석 기자 2024. 7. 25. 11:34
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

광주과학기술원(GIST)은 AI대학원 안창욱 교수 연구팀이 몬테카를로 트리 탐색(MCTS) 방법을 '스타크래프트 II'에 적용해 기존 MCTS에 비해 1만 배 빠르게 게임 상황을 예측, 탐색 효율성과 성능 안정성을 획기적으로 향상시켰다고 25일 밝혔다.

연구팀은 가상으로 재현된 게임 데이터를 학습해 대체 모델을 구축하고 이를 활용해 시뮬레이션의 일부 결과만으로 상황 예측에 대한 기댓값을 추정할 수 있는 대체 모델 기반 MCTS 기법을 제안, 스타크래프트 II에 적용해 그 성능을 검증했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

자율주행, 주식거래 등 실세계 응용 문제 해결 위한 의사결정 활용 기대
안창욱 교수와 이동현 박사과정생(왼쪽부터)(광주과기원 제공)/뉴스1

(광주=뉴스1) 조영석 기자 = 광주과학기술원(GIST)은 AI대학원 안창욱 교수 연구팀이 몬테카를로 트리 탐색(MCTS) 방법을 '스타크래프트 II'에 적용해 기존 MCTS에 비해 1만 배 빠르게 게임 상황을 예측, 탐색 효율성과 성능 안정성을 획기적으로 향상시켰다고 25일 밝혔다.

이번 연구 성과는 게임뿐 아니라 실세계 문제에도 적용할 수 있을 것으로 기대된다.

'몬테카를로 방법(MCTS)'이란 함수의 값을 확률적으로 계산하는 알고리즘으로 도박의 도시로 유명한 모나코 공국 몬테카를로(Monte-Carlo)에서 유래됐다.

무작위 시뮬레이션을 기반으로 상황 예측에 대한 기댓값을 추정하는 기존 MCTS 기법은 실행 시간이 오래 걸리고 복잡해 높은 연산량이 요구되는 실시간 전략 게임(RTS)에 적용하는 데 한계가 있다.

연구팀은 가상으로 재현된 게임 데이터를 학습해 대체 모델을 구축하고 이를 활용해 시뮬레이션의 일부 결과만으로 상황 예측에 대한 기댓값을 추정할 수 있는 대체 모델 기반 MCTS 기법을 제안, 스타크래프트 II에 적용해 그 성능을 검증했다.

연구팀이 개발한 기법은 대체 모델을 활용해 게임 내 상태에 대한 기댓값을 시뮬레이션 없이 바로 추정, 시뮬레이션 추론 시간을 밀리초(1천분의 1초)에서 초 단위 범위로 줄이는 데 성공했다.

연구팀은 또 연구의 확장성과 재현성을 높이기 위해 대체 모델 학습을 위한 데이터 수집과 스타크래프트 II에서 데이터 분석이 가능한 자체 소프트웨어를 구현하는 데 성공했다.

수집된 데이터를 기반으로 대체 모델을 학습한 후 적용한 결과 게임의 진행 결과를 기존 MCTS 대비 1만 배 빠르게 예측했다.

안창욱 교수는 "이번 연구 성과는 몬테카를로 트리 탐색 기법의 활용이 불가능하던 실시간 게임 환경에서 각 개체의 공격이나 후퇴 등 실시간 행동 결정을 가능하게 했다는 데 의의가 있다"며 "향후 상충하는 이해관계 갖는 실세계 응용 문제(자율주행, 주식거래 등)에 있어 실시간 의사결정을 내리는 데 활용될 수 있을 것으로 기대된다"고 말했다.

kanjoys@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?