“판다 발가락이 6개?”…중국 동영상 생성 인공지능 출시

윤창수 2024. 4. 30. 11:25
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

미국의 인공지능 기술을 따라잡기 위해 안간힘을 쓰고 있는 중국이 오픈AI의 동영상 생성 인공지능(AI) 도구인 '소라'의 대항마 '비두(Vidu)'를 내놓았다.

오픈AI의 소라가 60초의 동영상을 제작하는 데 비해 중국의 비두는 간단한 텍스트를 기반으로 1080p 해상도의 16초 이하 비디오를 생성할 수 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

지난해 3월 설립된 중국 스타트업, 동영상 생성 AI ‘비두’ 선보여
미국 오픈AI ‘소라’의 대항마…중국은 첨단 AI칩 수입 규제받아
중국 스타트업의 동영상 생성 인공지능 ‘Vidu’가 만든 판다 이미지. 발가락 숫자가 5개보다 많다.

미국의 인공지능 기술을 따라잡기 위해 안간힘을 쓰고 있는 중국이 오픈AI의 동영상 생성 인공지능(AI) 도구인 ‘소라’의 대항마 ‘비두(Vidu)’를 내놓았다.

중국 중앙(CC)TV는 29일 중국 스타트업 ‘셍슈 테크놀로지’가 명문 칭화대와 공동 노력을 통해 문자를 영상으로 만들어내는 AI인 ‘비두’를 출시했다고 보도했다.

오픈AI의 소라가 60초의 동영상을 제작하는 데 비해 중국의 비두는 간단한 텍스트를 기반으로 1080p 해상도의 16초 이하 비디오를 생성할 수 있다.

셍슈 테크놀로지의 최고 과학자이자 칭화대 AI 연구소의 부원장이기도 한 주쥔은 베이징 중관춘 포럼에서 “비두는 자립적 혁신의 최신 성과이며 많은 분야에서 획기적인 발전을 이루었다”라고 말했다.

중국 스타트업의 동영상 생성 인공지능 ‘Vidu’가 만든 이미지. 중국 중앙(CC)TV 캡처

그는 “비두가 상상력이 풍부하고, 실제 세계를 시뮬레이션할 수 있으며 일관된 캐릭터, 장면 및 타임라인으로 16초짜리 비디오를 제작할 수 있다”고 설명했다. 게다가 비두는 판다, 용 등 ‘중국적인 요소’도 이해하며 이미지를 생성할 수 있다고 덧붙였다.

모델 공개 과정에서 셍슈 테크놀로지는 기타를 연주하는 판다와 수영장에서 수영하는 강아지 등 여러 데모 영상 클립을 공개했는데 생생한 디테일을 보여준다는 평가를 받았다.

하지만 인공지능이 손가락, 발가락 등 섬세한 이미지 생성에서 보이는 오류를 비두 역시 반복했다. 기타를 치는 판다의 발가락이 5개가 아니라 6~7개로 보인다고 중국 네티즌들은 지적했다. 게다가 판다의 앞발에는 발톱이 아예 없다.

그럼에도 지난 2월 오픈AI가 동영상 생성 인공지능 소라를 공개한 지 두 달여 만에 중국에서 비슷한 서비스를 내놓자 일각에서는 희망 섞인 전망을 내놓고 있다. 경쟁이 치열한 AI 시장에서 짧은 시간에 제품을 생산한 것은 고무적이란 평가다.

중국 스타트업의 동영상 생성 인공지능 ‘Vidu’가 만든 이미지.

중국은 AI 기술 격차를 따라잡는 데 있어 미국의 첨단 칩 규제 때문에 적잖은 애로를 겪고 있다.

예를 들어 소라가 1분짜리 동영상을 제작하려면 8개의 엔비디아 A100 그래픽 처리 장치(GPU)가 3시간 이상 돌아가야만 한다. 하지만 미국은 A100, H100 GPU 등 엔비디아 등이 생산하는 첨단 칩을 중국으로 수출하는 것을 금지했다. 엔비디아의 A100과 H100 GPU는 AI 시스템 훈련용 부품으로 인기가 높다.

중국 베이징에 본사를 둔 셍슈 테크놀로지는 2023년 3월에 설립되었으며 핵심 연구원은 칭화대 AI 연구소 및 알리바바, 텐센트, 바이트댄스 등에서 온 직원 80여명으로 구성됐다. 알리바바 역시 자체적으로 문자를 영상으로 생성하는 AI 모델을 개발 중이다.

윤창수 전문기자

Copyright © 서울신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?