오픈AI "명령어 입력하면 고화질 영상 완성"...AI모델 '소라' 공개

남혁우 기자 2024. 2. 16. 11:04
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI가 간단한 프롬프트 명령어로 60초 분량의 고화질 영상을 제작할 수 있는 생성형 AI 서비스를 공개했다.

소라는 높은 수준의 영상품질과 사용자의 메시지를 준수하며 최대 1분 길이의 비디오를 제작할 수 있는 생성형 AI다.

오픈AI 측은 "정식으로 소라를 사용하기에 앞서 안전하게 사용할 수 있도록 몇가지 중요한 안전조치를 취하려 한다"며 "편견, 혐오 관련 도메인 전문가인 레드팀과 협력해 모델을 적극적으로 테스트 할 것"이라고 밝혔다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

학습 데이터 바탕으로 세부적인 요소까지 자연스럽게 구현

(지디넷코리아=남혁우 기자)오픈AI가 간단한 프롬프트 명령어로 60초 분량의 고화질 영상을 제작할 수 있는 생성형 AI 서비스를 공개했다.

15일(현지시간) 테크크런치 등 외신에 따르면 오픈AI는 텍스트 투 비디오(Text To Video) 모델 '소라(Sora)'를 공개하고 테스트에 돌입했다고 밝혔다.

소라는 높은 수준의 영상품질과 사용자의 메시지를 준수하며 최대 1분 길이의 비디오를 제작할 수 있는 생성형 AI다.

오픈AI에서 텍스트로 영상을 제작할 수 있는 생성형AI 소라를 공개했다(이미지=오픈AI)

프롬프트를 정확하게 해석하고 이를 영상으로 표현할 수 있도록 달리3에 적용된 시각 훈련 데이터를 적용해 언어에 대한 이해도를 높였다.

소라는 데이터 학습을 통해 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있다. 또한 실제 세계에 대한 이해를 바탕으로 사용자가 요청한 내용 외에도 사실적인 표현을 위해 세부적인 요소들이 영상에 자연스럽게 추가된다.

다만 오픈AI는 아직 소라가 완전한 제품이 아니라고 밝혔다. 복잡한 장면의 물리 표현을 시뮬레이션하는 데 어려움을 겪을 수 있으며 특정 상황의 원인과 결과에 대해 완전히 표현하지 못할 가능성이 있다.

오픈AI에서 텍스트로 영상을 제작할 수 있는 생성형AI 소라를 공개했다(이미지=오픈AI)

예를 들어 쿠키를 베어 물었을 때 쿠키에 물린 자국이 표현되지 못할 수 있다는 것이다. 왼쪽과 오른쪽 표현이 잘못 표현되는 등 공간적 세부사항이 혼동될 가능성도 있으며 잘못된 정보나 편견이 포함된 영상이 제작될 우려도 있다.

오픈AI 측은 “정식으로 소라를 사용하기에 앞서 안전하게 사용할 수 있도록 몇가지 중요한 안전조치를 취하려 한다”며 “편견, 혐오 관련 도메인 전문가인 레드팀과 협력해 모델을 적극적으로 테스트 할 것”이라고 밝혔다.

이어서 “우리는 AI가 창의적인 전문가에게 가장 도움이 되는 모델을 발전시키는 방법을 모색하고 있다”며 “이를 위해 다수의 시각 예술가, 디자이너 및 영화 제작자에게 액세스 권한을 부여하고 의견을 듣고 있다”고 설명했다.

남혁우 기자(firstblood@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.