“물리적 세계 이해하는 AI 만들자”... AI 연구 다음 단계는 일반세계모델(General World Models)

이덕주 특파원(mrdjlee@mk.co.kr) 2024. 2. 19. 14:21
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI가 텍스트를 입력하면 영상을 만들어주는 인공지능 소라(Sora)를 공개하면서 일반세계모델(General World Models)에 대한 관심이 커지고 있다.

이처럼 AI가 물리적 세계를 이해하는 것은 AGI(일반인공지능)로 다가가는 중요한 기술이면서 동시에 동영상 생성, 자율주행, 로보틱스까지 활용도가 높을 것으로 예상된다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI스타트업 런웨이가 연구하고 있다고 공개한 ‘일반세계모델’. <런웨이>
오픈AI가 텍스트를 입력하면 영상을 만들어주는 인공지능 소라(Sora)를 공개하면서 일반세계모델(General World Models)에 대한 관심이 커지고 있다. 거대언어모델(LLM), 멀티모달에 이어 일반세계모델을 구축하는 것이 AI개발의 다음 단계가 될 것이라는 분석이 나온다.

오픈AI는 15일 ‘소라’를 공개하면서 ‘움직이는 물리적 세계를 이해하고 시뮬레이션하는 방법을 AI에 가르치고 있다’고 밝혔다. 소라가 물리적 세계를 AI에게 학습시키는 과정에서 나온 결과물이라는 것이다. 이는 ‘소라’로 생성된 영상들의 품질이 매우 높은 이유다.

‘일반세계모델’의 개념은 2018년 당시 구글브레인 소속이었던 ‘데이비드 하’가 논문을 통해서 소개한 개념으로 알려져있다. AI가 일반세계의 물리적 법칙을 이해하도록 학습을 시킨다는 개념이다. 이를 통해 훨씬 효율적이고 뛰어난 성능의 AI를 만들 수 있다.

공을 하늘로 던지면 다시 땅으로 떨어지고, 유리에 사물이 비춰진다는 것은 인간만이 알고 있는 물리적 세계에 대한 지식으로 인공지능은 학습하기 어려운 것이었다.

하지만 우리가 아기일때부터 현실세계의 움직임을 지켜보면서 자연스럽게 물리적 세계의 법칙을 이해하는 것처럼, AI도 많은 동영상을 학습하면 물리적 세계를 이해할 수도 있다는 것이 AI연구자들의 설명이다.

테슬라가 자율주행차에게 학습시키고 있는 일반세계모델에 대한 설명. <사진=테슬라>
오픈AI에 앞서 ‘텍스트 투 비디오’를 만들던 AI스타트업 ‘런웨이’는 지난해 12월 자신들이 일반세계모델(GWM)을 만들고 있다고 밝힌 바 있다.

일론 머스크도 ‘소라’가 인터넷에서 화제가 되자 17일 자신의 X 계정에 테슬라가 연구하고 있는 GWM 영상을 공유했다. 테슬라는 지난 6월 자율주행 성능을 높이기 위해 AI에게 GWM을 학습시키고 있다고 밝힌 바 있다. 자율주행차량이 물리적인 세계에 대한 이해를 하고 있다면 예기치 못한 상황에 더 잘 대처할 수 있기 때문이다.

이처럼 AI가 물리적 세계를 이해하는 것은 AGI(일반인공지능)로 다가가는 중요한 기술이면서 동시에 동영상 생성, 자율주행, 로보틱스까지 활용도가 높을 것으로 예상된다.

[실리콘밸리=이덕주 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?