블로그 글이 영상으로… 네이버, AI 미디어 내일 연다
게시물 맥락 이해하고 숏폼 자동생성 ‘오토클립Ai’ 전략 공개
비전·모션 스테이지 시각 압도, 증강·가상·혼합현실 포괄 XR

바야흐로 AI 시대다. 삼성 빅스비, 애플의 시리 등 스마트폰 음성 비서를 시작으로 챗봇 챗GPT, 온라인 쇼핑까지. 우리 일상에 AI가 깊숙이 스며든 상황 속 네이버가 결이 다른 AI 영상 콘텐츠 전략을 공개했다.
지난 16일 네이버는 성남 정자동 네이버 그린팩토리에서 ‘이머시브 미디어 플랫폼(Immersive Media Platform) 테크 포럼’을 열고 연내 AI가 접목된 다양한 영상 기술과 XR 콘텐츠 플랫폼 등을 순차 공개한다고 밝혔다.
네이버는 지난 2012년 선보인 ‘네이버 TV 캐스트’를 시작으로 NOW, VLIVE 등 다년간 지속해온 영상 서비스를 통해 콘텐츠의 사전 처리, 전송, 사용자 재생에 이르는 과정에 소요되는 미디어 기술 역량을 높여왔다. 이를 통해 쇼핑라이브, 치지직 등 실시간 상호작용이 중요한 고화질 라이브 스트리밍 서비스를 안정적으로 제공 중이다.
올해에는 네이버가 쌓아온 영상 미디어 기술력에 AI 기술이 녹아든다. 앞서 지난해 11월 네이버는 콘퍼런스 ‘단(DAN) 24’를 통해 네이버의 기존 서비스에 AI를 접목하는 ‘온 서비스 AI 전략’을 밝힌 바 있다. 지난 3월 온 서비스 AI 첫걸음인 ‘네이버플러스 스토어’를 출시한 이후 영상 분야에서 온 서비스 AI 방향점을 제시한 것이다. 이른바 ‘비전 테크 트라이앵글’ 기술로 부르는 ▲미디어 AI ▲XR 스튜디오 ▲버추얼 스트리밍이다.


네이버는 텍스트 콘텐츠를 영상으로 만들어주는 오토클립Ai를 선보일 예정이다. 이를테면 글과 사진으로 된장찌개 끓이는 방법을 소개한 블로그 게시물을 Ai가 영상으로 만들어주는 기술이다. 파워포인트 ‘슬라이드’와 흡사한 기능이다. 멀티모달 LLM을 활용해 블로그 맥락을 이해하고 요약해 숏폼에 최적화된 내용을 자동 생성하는 기술이란 게 김성호 네이버 이머시브 미디어 플랫폼 리더의 설명이다.
새로운 기술 중 ‘비전·모션 스테이지’는 시각을 압도했다. 네이버 1784 사옥 지하 1층에 마련된 버추얼 콘텐츠 특화 스튜디오다. 이머시브 미디어 플랫폼 대표 사례로, 미디어 환경에서 액터가 사람에서 버튜버 등 아바타로 넘어가는 등 버추얼 콘텐츠 수요가 늘어난 것을 반영했다.
스튜디오를 둘러보니 홈쇼핑이나 뉴스처럼 카메라로 촬영한 것을 단순하게 송출하는 것을 넘어 실시간으로 가상 배경과 아바타가 화면에 적용됐다. 카메라로 잡은 화면 속에선 실제 사람과 아바타가 쌍방향 소통 중이라고 인지할 정도였다. 가상의 캐릭터가 끊김없이 부드럽게 움직여서다.
오한기 네이버 리얼타임 엔진 스튜디오 리더는 “디지털 기술과 실시간 랜더링이 접목, 시간과 비용은 획기적으로 줄이고 창작 환경에 유연하게 대응할 수 있다”며 “지난해에는 배경 정도만 AI로 했다면, 최근에는 모션 스테이지를 활용해 버추얼 스트리머가 라이브를 할 정도까지 업데이트를 하고 있다”고 말했다.
네이버는 XR 콘텐츠 시장을 주목 중이다. XR은 증강현실(AR), 가상현실(VR), 혼합현실(MR)을 포괄하는 기술이다. 네이버는 안드로이드 운영체제 기반 콘텐츠 플랫폼을 준비하겠다는 구상이다. 김성호 리더는 “이번에 선보인 비전 AI 기술 고도화로 주요 서비스 분야에서 창작 활성화를 이끌어 사용자에게 온·오프라인을 넘나드는 미디어 경험을 제공할 것”이라고 강조했다.
/윤혜경 기자 hyegyung@kyeongin.com
Copyright © 경인일보 All rights reserved. 무단전재 및 재배포 금지.