영상도 AI 경쟁 시대…구글 ‘비오3’, 오픈AI ‘소라’와 비교했더니…

이재연 기자 2025. 6. 17. 07:06
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"부엉이가 눈으로 뒤덮인 울창한 숲속을 날아서 갈색 머리 여자아이의 손에 착지하는 모습을 보여줘."

구글의 동영상 생성 인공지능(AI) 모델 '비오(Veo) 3'에 이렇게 지시하자, 단 2분 만에 생동감 넘치는 8초짜리 영상이 탄생했다.

아울러 부엉이와 소녀가 나무로 빽빽하게 에워싸인 비오 3 영상과 달리, 소라 영상에서는 마치 바탕화면을 띄워둔 것처럼 나무들이 피사체 뒤에 멀찍이 위치했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

단 2분만에 생생한 8초 영상 ‘뚝딱’
구글 ‘비오(Veo) 3’로 만든 영상 갈무리. “부엉이가 눈으로 뒤덮인 울창한 숲속을 날아서 갈색 머리 여자아이의 손에 착지하는 모습을 만들어달라”고 지시했다.

“부엉이가 눈으로 뒤덮인 울창한 숲속을 날아서 갈색 머리 여자아이의 손에 착지하는 모습을 보여줘.”

구글의 동영상 생성 인공지능(AI) 모델 ‘비오(Veo) 3’에 이렇게 지시하자, 단 2분 만에 생동감 넘치는 8초짜리 영상이 탄생했다. 눈송이가 소녀의 머리카락과 옷을 스쳐 흩날리는 모습은 물론, 부엉이가 바람을 가르며 날갯짓을 하고 착지하는 소리까지 마치 현실처럼 생생했다. “창작의 혁명”이라는 일각의 평가에 일견 수긍하게 되는 완성도였다.

미국 구글이 지난달 공개한 야심작 ‘비오 3’가 장안의 화제다. 지난해 세상을 한 차례 놀라게 했던 오픈에이아이(AI)의 영상 생성 모델 ‘소라’를 압도한다는 평가가 많다. 인공지능으로 영상을 만드는 기술이 그만큼 빠르게 진화하고 있는 셈이다. 두 모델을 16일 직접 비교해봤다.

오픈에이아이(AI) ‘소라’로 만든 영상 갈무리. “부엉이가 눈으로 뒤덮인 울창한 숲속을 날아서 갈색 머리 여자아이의 손에 착지하는 영상을 만들어달라”고 지시했다.

먼저 시각적 측면에서 비오 3가 소라보다 월등하다는 인상을 받았다. 소라가 만든 5초짜리 ‘부엉이와 소녀’ 영상에서는 바람에 날리는 눈송이처럼 현장감을 더해주는 디테일을 찾아볼 수 없었다. 아이 앞에 있던 부엉이가 순식간에 뒤편으로 이동하는 등 오류에 가까운 장면도 포착됐다. 아울러 부엉이와 소녀가 나무로 빽빽하게 에워싸인 비오 3 영상과 달리, 소라 영상에서는 마치 바탕화면을 띄워둔 것처럼 나무들이 피사체 뒤에 멀찍이 위치했다.

구글 ‘비오(Veo) 3’로 만든 영상 갈무리. “가랑비가 내리는 선착장에 어부와 선원, 상인 등 다양한 사람들 붐비는 가운데, 고대 북유럽 남성이 정박 중인 배 위로 뛰어내리는 영상을 만들어달라”고 지시했다.

지시를 이행하는 정확도는 둘 다 아쉬운 대목이 있었다. 요구 사항이 구체적이고 복잡할수록 이런 경향이 심해졌다. 가령 비 내리는 선착장에서 북유럽 남자가 정박 중인 배에 뛰어내리는 모습을 주문하자, 비오 3는 남자가 선착장 위 제자리에서 껑충 뛰는 영상을 만들었다. 소라가 만든 영상 속 남자는 움직임이 너무 부자연스러워서 마치 춤을 추는 것 같았다. 선착장이 다양한 사람들로 붐벼야 한다는 지시도 소라 영상에는 제대로 반영되지 않았다.

오픈에이아이(AI) ‘소라’로 만든 영상 갈무리. “가랑비가 내리는 선착장에 어부와 선원, 상인 등 다양한 사람들 붐비는 가운데, 고대 북유럽 남성이 정박 중인 배 위로 뛰어내리는 영상을 만들어달라”고 지시했다.

전반적으로는 소라보다 비오 3가 지시 사항에 충실한 편이었다. 우주선 창밖으로 해파리 한 마리가 지나가자 무중력 상태로 떠 있던 비행사들이 놀라는 모습을 만들어달라고 해봤다. 비오 3는 지시에 대체로 부합하는 영상을 완성했다. 비행사들의 시선이 가끔 해파리가 아닌 허공을 향한다는 점 정도가 아쉬운 수준이었다. 반면 소라 영상 속 비행사는 무중력 상태로 떠 있는 대신 바닥에 앉아 있었고, 해파리를 본 뒤 놀라는 모습도 찾기 어려웠다.

구글 ‘비오(Veo) 3’로 만든 영상 갈무리. “우주선 창밖으로 거대한 해파리 한 마리가 빛을 내면서 지나가자, 무중력 상태로 떠 있던 비행사들이 놀라며 혼란스러워하는 영상을 만들어달라”고 지시했다.

소라가 음성을 제공하지 않는다는 방침이어서 오디오 완성도는 비교할 수 없었다. 구글의 비오 3는 상황을 설명해주면 직접 대사를 만들어서 영상에 넣기도 한다. 가령 우주선 속 비행사들은 “저게 뭐냐(What is that thing)”고 물어보고, “이런 건 처음 본다(I’ve never seen anything like it)”고 말하며 숨을 들이키기도 했다. 대사와 입 모양이 맞지 않는다는 점은 아쉬웠다.

오픈에이아이(AI) ‘소라’로 만든 영상 갈무리. “우주선 창밖으로 거대한 해파리 한 마리가 빛을 내면서 지나가자, 무중력 상태로 떠 있던 비행사들이 놀라며 혼란스러워하는 영상을 만들어달라”고 지시했다.

이재연 기자 jay@hani.co.kr

Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지