크래프톤, 언어 모델 기반 게임 AI를 평가하는 벤치마크 '오락' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
크래프톤은 대규모 언어 모델(Large Language Model, 이하 LLM)을 기반으로 한 AI 에이전트의 게임 수행 능력을 평가할 수 있는 성능 비교 체계인 '오락(Orak)'을 공개했다.
'오락'은 오락에서 착안한 이름으로 게임 환경에서 AI의 상황 인식과 판단, 행동 결정 과정을 정량적으로 분석할 수 있는 평가 체계다.
이를 바탕으로 LLM 기반 AI 에이전트가 복잡한 게임 맥락 속에서 상황을 해석하고 결정하는 능력을 평가한다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'오락'은 오락에서 착안한 이름으로 게임 환경에서 AI의 상황 인식과 판단, 행동 결정 과정을 정량적으로 분석할 수 있는 평가 체계다. 액션, 어드벤처, RPG, 시뮬레이션, 전략, 퍼즐 등 총 6개 장르의 대중적인 게임을 기반으로 설계됐다.
이 체계에는 크래프톤과 엔비디아가 공동 개발한 CPC(Co-Playable Character)를 통해 축적한 AI 설계 경험이 반영됐다. 이를 바탕으로 LLM 기반 AI 에이전트가 복잡한 게임 맥락 속에서 상황을 해석하고 결정하는 능력을 평가한다. '오락'을 통해 CPC를 포함한 AI 에이전트의 게임 능력을 반복적으로 검증할 수 있다.
핵심 기술로는 MCP(Model Context Protocol)가 있다. MCP는 게임 정보를 언어 모델이 이해할 수 있는 텍스트 기반의 정보로 전달하고, 모델의 응답을 게임에 적용 가능한 행동으로 변환하는 역할을 한다. 이를 통해 LLM은 게임 플레이어처럼 작동해, 게임의 상태를 텍스트나 이미지로 받아들여 최적의 행동을 선택할 수 있다. 액션 게임에서는 장애물의 위치를 인식한 뒤 이동이나 점프와 같은 판단을 수행하게 된다.
최종배 jovia@fomos.co.kr
Copyright © 포모스. 무단전재 및 재배포 금지.