일레븐랩스, 스푼랩스에 'AI 음성' 공급…"콘텐츠 제작 기간↓"

김미정 기자 2026. 5. 6. 11:46
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

일레븐랩스가 인공지능(AI) 음성 기술을 앞세워 오디오 콘텐츠 제작 구조를 대량 생산 시스템으로 전환했다.

일레븐랩스는 글로벌 오디오 플랫폼 기업 스푼랩스와 전략적 협력을 통해 신규 오디오 소설 서비스 '팟노블' 제작에 AI 음성 기술을 적용했다고 6일 밝혔다.

홍상원 일레븐랩스코리아 지사장은 "글로벌 오디오 플랫폼 시장을 선도하는 스푼랩스와 협업을 통해 우리 음성 AI를 기반으로 오디오 콘텐츠 제작 방식을 근본적으로 개선할 수 있어 매우 뜻깊었다"고 말했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국·일본·대만 오디오 콘텐츠 동시 확장 목표

(지디넷코리아=김미정 기자)일레븐랩스가 인공지능(AI) 음성 기술을 앞세워 오디오 콘텐츠 제작 구조를 대량 생산 시스템으로 전환했다.

일레븐랩스는 글로벌 오디오 플랫폼 기업 스푼랩스와 전략적 협력을 통해 신규 오디오 소설 서비스 '팟노블' 제작에 AI 음성 기술을 적용했다고 6일 밝혔다. 스푼랩스는 이를 기반으로 한국 일본 대만 3개국 시장을 겨냥한 오디오 콘텐츠를 동시에 출시했다.

이번 협력 핵심은 제작 기간 단축이다. 기존 성우 녹음 방식은 콘텐츠 한 편을 만드는 데 4~7개월이 걸렸지만 일레븐랩스 AI 음성 솔루션 도입 이후 제작 기간은 수 시간 수준으로 줄었다는 설명이다. 

일레븐랩스가 인공지능(AI) 음성 기술을 앞세워 오디오 콘텐츠 제작 구조를 대량 생산 시스템으로 전환했다. (사진=일레븐랩스)

스푼랩스는 기존 라이브 오디오 중심 사업에서 스토리 기반 오디오 콘텐츠로 사업 영역을 넓히는 과정에서 제작 공정을 재설계했다. 긴 제작 기간과 높은 비용 구조, 콘텐츠 확장성 제약을 해결하기 위해 AI 음성 기술을 도입했다.

일레븐랩스는 텍스트 음성 변환뿐 아니라 문맥과 감정을 반영하는 음성 구현에 초점을 맞췄다. 스푼랩스는 국내외 여러 텍스트 음성 변환 솔루션을 실제 제작 환경에 가까운 조건에서 검토한 뒤 일레븐랩스를 선택했다고 밝혔다.

평가 과정에서는 문장 부호에 따른 억양 변화와 기쁨, 슬픔, 분노 등 문맥 기반 감정 표현력이 주요 기준으로 다뤄졌다. 일레븐랩스는 단순히 글을 읽는 수준이 아니라 상황을 파악해 연기에 가까운 발화를 구현했다는 평가를 받았다.

스푼랩스는 지난 1월 한국 30종, 일본 26종, 대만 19종 팟노블 콘텐츠를 출시했다. 이달부터 국가별 매주 3종 이상 신규 콘텐츠를 출시해 단기적으로 100종 이상의 콘텐츠 라인업을 확보할 계획이다.

일레븐랩스는 8일까지 열리는 서울 코엑스에서 열리는 'AI엑스포 2026'에 참여한다. 

김현 스푼랩스 팟노블 콘텐츠팀장은 "오디오 콘텐츠 핵심은 결국 '재미'이며 이를 위해서는 음성 품질이 반드시 뒷받침돼야 한다"며 "일레븐랩스는 단순한 문맥과 감정을 이해하는 '연기' 수준의 기술을 제공했다"고 밝혔다.

홍상원 일레븐랩스코리아 지사장은 "글로벌 오디오 플랫폼 시장을 선도하는 스푼랩스와 협업을 통해 우리 음성 AI를 기반으로 오디오 콘텐츠 제작 방식을 근본적으로 개선할 수 있어 매우 뜻깊었다"고 말했다.

김미정 기자(notyetkim@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.