“게임 개발에도 도움이?” 구글 딥마인드, 시각적 일관성 담은 3D 월드 생성 모델 ‘지니 3’ 공개

신승원 2025. 8. 6. 10:45
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

지난 5일 구글 딥마인드(DeepMind)는 실시간으로 인터랙티브 3D 세계를 생성할 수 있는 월드 생성 모델 '지니 3(Genie 3)'를 발표했다.

설명에 따르면 '지니 3'는 텍스트 프롬프트만으로도 초당 24 프레임, 720p 해상도로 수 분간 일관된 세계를 구현할 수 있고, 게임 개발이나 로봇 훈련, 교육 콘텐츠 등에 활용할 수 있다.

이용자가 프롬프트를 입력하면, '지니 3'은 그에 맞춰 세계를 즉석에서 생성한다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

차후에는 오픈월드 게임 개발의 핵심이 될까?

지난 5일 구글 딥마인드(DeepMind)는 실시간으로 인터랙티브 3D 세계를 생성할 수 있는 월드 생성 모델 ‘지니 3(Genie 3)’를 발표했다. 설명에 따르면 ‘지니 3’는 텍스트 프롬프트만으로도 초당 24 프레임, 720p 해상도로 수 분간 일관된 세계를 구현할 수 있고, 게임 개발이나 로봇 훈련, 교육 콘텐츠 등에 활용할 수 있다.

지니3 생성, 입력된 방향키를 인식하고 캐릭터가 방향을 조절한다 / 구글 딥마인드

지니 3의 가장 큰 특징은 바로 ‘실시간 상호작용성과 장기적 시각적 일관성’이다. 이용자가 프롬프트를 입력하면, ‘지니 3’은 그에 맞춰 세계를 즉석에서 생성한다. 이용자 혹은 AI 에이전트는 이 세계를 실시간으로 탐색하며 상호작용할 수 있고, 카메라가 다른 방향을 바라보고 돌아왔을 때도 이전에 생성된 환경 요소들이 그대로 유지된다.

고개를 돌려도 나무의 위치가 같다

기술적으로 지니 3은 자기 회귀적 프레임 생성을 바탕으로 상호작용성을 구현했다. 이전에 생성된 환경 궤적을 지속적으로 참조하면서도, 이용자의 새로운 입력이 있을 때마다 초당 수십 회의 계산을 통해 물리적 일관성을 유지하는 것이 핵심이다. 모델은 최대 1분 전 생성된 정보까지 기억해, 장기간 일관된 환경을 유지하는데 성공했다.

다만 ‘지니 3’은 아직까지 몇 개의 제한사항이 존재한다. 실제 지리적 장소의 완벽한 재현은 어렵고, 간단한 단어 외 복잡한 문장과 같은 텍스트 렌더링에는 한계가 있다. 또한 아직은 장시간의 연속 플레이를 염두에 두지 않아, 수분 내외의 인터랙션에서만 높은 일관성을 유지하는 수준에 머물러 있다. 장시간의 시뮬레이션 동안 누적되는 데이터 불일치를 해결하는 것은 향후 기술적 과제가 될 전망이다.

구글 딥마인드의 관계자는 “‘지니 3’이 세계 모델에 있어 중요한 전환점이 될 것이라고 생각한다.”, “인류의 이익을 위해 안전하고 책임감 있게 개발하고 있다.”라고 말했다.

사용자 중심의 게임 저널 - 게임동아 (game.donga.com)

Copyright © 게임동아. 무단전재 및 재배포 금지.