“이젠 나도 방구석 봉준호”…텍스트 입력하니 영화 한편이 짠 [어도비 맥스 2024]

고민서 기자(esms46@mk.co.kr) 2024. 10. 15. 03:57
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

어도비 생성AI ‘파이어플라이’
이미지 넘어 영상까지 ‘뚝딱’
학습되는 원천 데이터 모두
저작권 침해 논란서 자유로워
“상업적으로 안전해” 차별화
샨타누 나라옌 어도비 최고경영자(CEO)가 14일(현지시간) 미국 플로리다주 마이애미에서 열린 세계 최대 규모의 크리에이티브 콘퍼런스 ‘어도비 맥스 2024’에서 자사의 생성형 AI 모델군 ‘파이어플라이’로 구동되는 주요 솔루션을 소개하고 회사의 방향성에 대해 밝히고 있다. [고민서 기자]
‘화산 내부에서 용암으로 만든 작은 아기 용의 모습을 표현해줘’ 프롬프트(명령창)에 머릿속 상상의 장면을 텍스트로 입력하자, 용이 마치 살아 움직이듯 생생한 비디오가 단숨에 만들어졌다.

또 흑갈색의 고양이 사진을 업로드한 뒤 ‘누군가를 향해 쳐다본 다음 잔디밭을 거니는 고양이의 모습을 보여줘’라고 명령했더니, 이내 이미지가 다큐멘터리 속 한 장면으로 재탄생했다.

어도비 파이어플라이 비디오 모델로 제작된 영상 스틸샷. 이미지를 업로드해 관련된 영상을 도출해 낼 수 있다. [영상 = 어도비]
포토샵으로 유명한 콘텐츠 제작 소프트웨어(SW) 전문 기업 어도비가 자사의 생성형 인공지능(AI) 모델군 ‘파이어플라이’로 구동되는 비디오 AI를 전격 공개했다. 지난해 텍스트를 이미지로 변환해 주는 이미지 AI를 내놓은 이후 시장으로부터 큰 호평을 받았던 어도비는 이번 비디오 AI를 통해서도 포토샵으로부터 시작된 ‘창작 맛집’의 자존심을 다시 한번 보여주겠다는 각오다.

샨타누 나라옌(Shantanu Narayen) 어도비 최고경영자(CEO)는 14일(현지시간) 미국 플로리다주 마이애미에서 열린 세계 최대 규모의 크리에이티브 콘퍼런스 ‘어도비 맥스 2024’(Adobe MAX 2024) 무대에 올라 “어도비는 생성형 AI가 갖고 있는 잠재력과 이것이 (창작자들을 지원할) 강력한 가능성으로 발현되고 있다는 것을 (누구보다도 더 깊이) 인지하고 지원에 앞장서고 있다”고 밝혔다.

그러면서 그는 “파이어플라이는 어도비의 제품군 전반에 탑재되며 빠르게 진화해나가고 있고, 그 안에서 많은 창작자들이 생성형 AI와 함께 일하는 방식의 새로운 접근법과 업무 과정의 간소화를 경험하며 종전보다 더욱 풍성해진 창의성을 경험하고 있다”고 강조했다.

데이비드 와드와니(David Wadhwani) 어도비 디지털 미디어 사업 부문 사장이 14일(현지시간) 미국 플로리다주 마이애미에서 열린 세계 최대 규모의 크리에이티브 콘퍼런스 ‘어도비 맥스 2024’에서 자사의 생성형 AI 모델군 ‘파이어플라이’가 갖고 있는 강점에 대해 설명하고 있다. [고민서 기자]
어도비 맥스는 사진작가부터 영상 제작자, 디자이너 및 인플루언서 등 다양한 창작의 영역에서 활동하는 크리에이터들을 위한 일종의 축제 성격이 강한 행사다. 어도비의 대표적인 콘텐츠 제작 솔루션인 포토샵(Photoshop·이미지 편집툴), 일러스트레이터(Illustrator·디자인툴), 프리미어 프로(Adobe Premiere Pro·영상 편집툴), 어도비 익스프레스(Adobe Express·올인원 크리에이티브 앱) 등이 채택한 100여종의 신규 기능을 소개하고, 여러 커뮤니티들이 함께 모여 어도비 솔루션을 필두로 보다 나은 창작 세계를 모색해 보는 네트워킹 자리이기도 하다. 올해는 1만여 명이 본 행사에 참여했다.

이날 현장의 주목도가 높았던 것은 어도비의 새로운 동영상 AI 모델인 ‘파이어플라이 비디오 모델’(Firefly Video Model)이었다. 앞서 선공개됐던 오픈AI의 ‘소라’(Sora)와 구글의 ‘비오’(Veo) 및 메타의 ‘무비 젠’(Movie Gen)을 겨냥한 듯 어도비는 이들 모델의 불확실한 요소인 ‘저작권 논란’을 정조준했다. 기본적으로 업계 유사 모델 이상의 우수한 성능을 가졌다는 점을 언급하면서도 무엇보다 저작권 침해 가능성이 전혀 없는 데이터만을 원천 학습용으로 사용했다는 대목을 거듭 강조했다.

데이비드 와드와니(David Wadhwani) 어도비 디지털 미디어 사업 부문 사장은 “파이어플라이 비디오 모델은 상업적으로 안전하게 만들어진 (업계) 첫번째 동영상 AI”라며 “다른 타사 모델과 달리 어도비는 (사용 권한을 가진) 보장된 콘텐츠 만을 AI 학습 데이터로 활용하고 있고, 이것이 타 사와의 차별화된 지점”이라고 말했다. 이와 관련해 어도비는 이번 파이어플라이 비디오 모델을 구축하면서 필요한 영상 데이터를 창작자들로부터 대거 사들이기도 했다.

동영상 편집 툴 부문 점유율 1위인 어도비의 ‘프리미어 프로’에 탑재된 ‘생성형 확장’ 기능. 영상 속 빈 간극을 AI가 자연스럽게 메워 주는 게 주된 특징이다. [영상 = 어도비]
이러한 어도비의 자신감을 보여주듯 이 회사는 이날 곧바로 프리미어 프로에 탑재된 파이어플라이 비디오 모델 일부 기능(생성형 확장·Generative Extend)을 오픈 베타 서비스로 풀었다. 동영상 AI 시장 참전을 선언했던 대다수 빅테크가 일부 사용자만을 대상으로 서비스를 한시 제공하거나 기술 구현도만 공개했던 것과 달리 어도비는 누구든지 프리미어 프로를 통해 바로 사용해 볼 수 있도록 한 것이다.

생성형 확장 기능은 영상 컷과 컷 사이로 발생한 공백을 앞뒤 흐름에 맞게 간극을 채워주는 비디오 생성 AI 솔루션으로, 오디오 클립을 확장하는 경우에도 배경음을 자연스럽게 연결해주기까지 한다.

가령 전체 영상 촬영분에서 중간중간 빠진 부분을 AI가 알아서 앞뒤를 자연스럽게 연결, 해당 부분 내 동영상을 자동 생성해 주는 식이다. 이 때문에 공백이 발생한 수초 분량을 위해 굳이 별도의 촬영을 하지 않아도 된다는 점에서 현장의 반응이 가장 뜨겁기도 했다.

디파 수브라마니암(Deepa Subramaniam) 어도비 크리에이티브 클라우드 부문 제품 마케팅 부사장은 “추가 영상 촬영 없이도 비디오에서 발생한 간극을 AI가 자동으로 메워주는 역할을 하는 것이 생성형 확장”이라며 “그동안 영상 제작자들이 가장 힘들어하고 요청이 많았던 솔루션이기도 하다”고 설명했다.

어도비 파이어플라이 비디오 모델로 제작된 영상 스틸샷. 텍스트 입력만으로 원하는 비디오를 단숨에 만들어낼 수 있다. [영상 = 어도비]
한편 어도비는 파이어플라이 비디오 모델의 또 다른 기능인 ‘텍스트를 영상으로’(Text to Video)와 ‘이미지를 영상으로’(Image to Video)를 파이어플라이 웹사이트에 적용했다. 다만 이 기능들은 이날부터 일부 신청자를 받아 향후 한시적으로 운영한 다음 보완 과정을 거쳐 정식 서비스로 출시하겠다는 게 어도비 계획이다.

어도비에 따르면 ‘텍스트를 영상으로’를 사용하면 한층 세분화된 글자 입력만으로 비디오를 만들어 낼 수 있고 이 과정에서 각도와 모션, 줌, 등 다양한 카메라 컨트롤까지 미세 조정하며 이미지를 참조해 타임라인의 빈 공간을 매끄럽게 메울 수 있는 ‘B-Roll’(비롤)을 생성할 수 있다. 또한 ‘이미지를 영상으로’는 정적인 형태의 스틸 사진이나 일러스트를 동적인 실사(비디오)로 변환해준다.

[마이애미 = 고민서 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?