“광고 만들어줘” 한마디에 ‘인스타그래머블’ 이미지 뚝딱… ‘멀티 모달 AI’ 스타트업

정래연 2025. 7. 23. 16:12
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"바닷가 배경에 우리 맥주 제품을 자연스럽게 넣어줘" 명령이 떨어지기 무섭게 고화질 광고 이미지가 만들어졌다.

이미지 생성을 시연한 인공지능(AI) 업체 패러닷 장진욱 대표는 "디자인 경험이 전혀 없는 사람도 이제 아이디어만 있으면 얼마든지 광고·마케팅 이미지와 영상을 만들 수 있다"며, "기획자와 디자이너 사이 경계가 점차 무너지고 있다"고 말했다.

챗GPT 등 거대언어모델(LLM)을 기반으로 이미지, 영상, 음성 등 각종 데이터를 복합적으로 다루는 AI를 의미한다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 생성 이미지 예시(패러닷 제공)


“바닷가 배경에 우리 맥주 제품을 자연스럽게 넣어줘” 명령이 떨어지기 무섭게 고화질 광고 이미지가 만들어졌다.

명령어 하나로 이미지·영상·음악까지 제작하는 시대다. 이미지 생성을 시연한 인공지능(AI) 업체 패러닷 장진욱 대표는 “디자인 경험이 전혀 없는 사람도 이제 아이디어만 있으면 얼마든지 광고·마케팅 이미지와 영상을 만들 수 있다”며, “기획자와 디자이너 사이 경계가 점차 무너지고 있다”고 말했다.

이처럼 최근 AI는 창작 영역에서까지 인간의 역할을 넘보고 있다. 그 중심에는 ‘멀티 모달 AI’가 있다. 챗GPT 등 거대언어모델(LLM)을 기반으로 이미지, 영상, 음성 등 각종 데이터를 복합적으로 다루는 AI를 의미한다. 단순히 질문에 답변을 해주는 역할에서 모든 데이터를 분석하고 콘텐츠까지 만들 수 있는 ‘만능 에이전트’로 진화하는 것이다. 국내에서는 행동력을 무기로 스타트업이 발빠르게 관련 서비스를 출시하고 있다.

패러닷 ‘캐럿’ 서비스 활용 예시(패러닷 제공)


패러닷의 ‘캐럿’은 콘텐츠 제작에 특화된 생성형 AI 플랫폼이다. △이미지·영상·음성·음악 생성 △영상 편집 △영상 요약 등 콘텐츠 마케터나 크리에이터가 일상적으로 수행하는 작업을 자연어 명령 만으로 처리할 수 있다.

최근에는 ‘AI 에이전트’로 발돋움하기 위해 자율성을 강화했다. 명령을 받은 에이전트는 스스로 의견을 내고, 콘텐츠 초안을 만들고, 수정과 편집을 진행한다. 제작에는 이마젠, 비오, 런웨이 등 기술 선도적인 모델을 활용하며, 특히 사용자 요구사항에 따라 적합한 생성형 AI 모델을 취사선택하는 ‘AI 오케스트레이션’ 기능으로 콘텐츠 완성도를 최대한 높일 수 있다.

예를 들어 “요가 브랜드 광고 영상 만들어줘”라고 입력하면, 영상 스크립트를 짜고, 여성 모델이 요가를 하는 장면을 생성하고, 여기에 배경 음악과 나레이션을 입히는 작업까지 스스로 수행하는 방식이다.

발빠른 기업은 이미 광고 제작에 AI를 적극적으로 활용한다. 캐럿 기업용 솔루션 ‘캐럿biz’ 고객사 LG유플러스는 5월 보도자료를 통해 ‘AX특공대’를 구성하고 광고 제작비를 약 95% 절감했다고 전했다. AX특공대는 AI 광고 제작을 전담하는 마케팅 그룹 산하 태스크포스(TF)다.

수시간에 달하는 영상 또한 AI를 활용하면 단 몇 초 만에 분석할 수 있다. 트웰브랩스는 영상 분석 AI를 전문적으로 개발한다. 스포츠 중계에서 결정적인 순간을 포착해야 하는 방송사, CCTV 데이터를 실시간으로 감지해 위험 상황을 조기에 발견해야 하는 기업과 지자체 등에서 트웰브랩스 서비스를 활용하고 있다.

대표 제품은 마렝고와 페가수스다. 페가수스는 영상을 분석해 요약문을 생성하거나 영상 내용에 대한 질의응답을 수행한다. 마렝고는 영상 내 텍스트, 이미지, 오디오 정보를 분석해 장면 검색 기능을 지원한다.

‘1인 1AI’를 보급해 생활형 AI 시대를 연다는 뤼튼은 4월 ‘뤼튼 3.0’ 업데이트를 발표하며 앞으로 뤼튼이 나아갈 방향을 ‘AI 서포터’로 정의했다. AI 검색, 보고서 작성 등 사용자가 요청한 일만을 수행하는 것이 아니라, 스스로 대화를 시작하고 이전 대화 맥락을 더욱 잘 기억하는 등 감정적인 유대를 형성할 수 있는 ‘동반자’로 거듭나겠다는 의도다.

최근에는 AI 음성 기반 영어 스피킹 기능을 선보였다. 단순 번역이나 문법 교정의 기능을 넘어, 사용자의 발화에 즉각 반응하고 적절한 피드백을 주는 몰입형 학습 경험이 가능하다는 평가다. 뤼튼 측은 이러한 서비스 확장을 전국민 1인 1AI 시대 실현의 일환이라고 설명한다.

정래연 기자 fodus0202@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.