오디오 플랫폼 구원투수로 나선 'AI 성우'

임영신 2021. 10. 31. 18:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

韓 지니뮤직·플로·바이브
AI기술로 사람 목소리 합성
오디오 드라마·북 등 서비스
유튜브 뮤직 공세 거세지자
오디오 콘텐츠 확보로 맞불
오디오 콘텐츠 확보 경쟁이 뜨겁다. 주인공은 KT의 지니뮤직, SK텔레콤의 플로, 네이버의 바이브로 대표되는 토종 음원 플랫폼들이다. 오디오 콘텐츠를 눈에 잘 띄는 애플리케이션(앱) 상단에 배치할 정도다. 최근 거세지는 구글의 유튜브뮤직 공세에 대응하기 위해 오디오 콘텐츠 서비스로 차별화를 시도하고 있다는 분석이 나온다.

31일 정보기술(IT) 업계에 따르면 지니뮤직은 최근 플랫폼 내 오디오 콘텐츠 서비스 '스토리G'를 신설했다. 오디오 콘텐츠를 빠르게 확보하기 위해 밀리의 서재를 인수했고, KT 스토리위즈 지식재산(IP)으로 오디오 드라마 제작을 추진하고 있다.

앞서 플로도 스푼·윌라와 손잡고 오디오 콘텐츠를 늘리고 있다. 네이버 바이브도 실시간 오디오 스트리밍 서비스 '나우'를 추가했다. 네이버 관계자는 "음원 스트리밍에 머물지 않고, 종합 오디오 서비스가 바이브의 방향성"이라고 말했다.

토종 플랫폼이 오디오 콘텐츠를 강화하는 것은 유튜브뮤직이 무섭게 치고 올라오고 있기 때문이다.

빅데이터 기업 아이지에이웍스의 모바일인덱스에 따르면 국내 음원 앱 점유율은 유튜브뮤직이 올해 9월 14.7%로 2월보다 3.5%포인트 오른 반면 같은 기간 1위 멜론은 줄고, 나머지 앱들은 0.5%포인트 안팎으로 상승하는 데 그쳤다. 유튜브뮤직이 국내 음원 플랫폼 점유율을 뺏어간 셈이다.

오디오 콘텐츠는 이용자를 플랫폼에 붙잡는 효과도 있다. 음악은 3분 정도지만 오디오 콘텐츠는 짧게는 10여 분, 길게는 수시간 분량이다.

업계 관계자는 "10대와 20대는 오디오 콘텐츠를 라디오처럼 소비한다"고 설명했다. 음성 인공지능(AI)의 역할도 커지고 있다. 지금까지 음악 일색의 플랫폼에선 청취 이력을 비롯한 이용자 데이터를 분석해 개인 맞춤형 음악을 추천하는 AI가 주류였지만, 이제는 대량의 텍스트(문자)를 음성으로 어떻게 들려줄지가 중요해졌다. 구원투수로 'AI 성우'가 데뷔하는 셈이다.

지니뮤직은 사람 목소리를 AI가 자동 생성하는 음성 합성 기술로 밀리의 서재가 보유한 전자책 수만 권을 오디오 콘텐츠로 전환하기로 했다.

KT 관계자는 "10분 안팎의 음성 데이터만으로 사람처럼 다양한 음색과 억양을 가진 목소리를 만들 수 있다"며 "AI 성우는 영어·중국어 등 외국어도 가능하다"고 했다. 바이브는 네이버 AI 클로바를 활용해 오디오 콘텐츠를 제작할 계획이다.

연예인 등의 말투와 감정 표현을 반영해 텍스트를 음성으로 바꾸고 이를 동영상에 입힐 수 있는 AI 기술을 개발했다. 초거대 AI '하이퍼클로바'도 적용해 음성 AI를 고도화할 계획이다.

오디오 콘텐츠에도 AI 기반 개인화 서비스가 도입된다. 지난 2월 한국에 상륙한 세계 최대 음원 플랫폼 스포티파이는 2019년 오디오 콘텐츠 사업을 본격 시작해 260만개 이상 팟캐스트 콘텐츠를 확보했다. 오디오 콘텐츠 이용자 데이터까지 충분히 쌓이면서 AI 추천 서비스를 내놓는 단계로 넘어갔다. AI가 이용자 취향을 분석해 매일 아침 개인 맞춤형 음악과 뉴스 콘텐츠를 묶어서 재생 리스트를 만들어주는 방식이다. 팟캐스트에서 핵심 부분만 뽑아서 짧은 오디오 클립을 생성하는 AI도 적용할 계획이다.

플로 관계자는 "오디오 관련 데이터가 누적되면 AI를 접목해 개인화 서비스를 검토하고 있다"며 "오디오 콘텐츠에서 음악을 어떻게 활용하면 좋을지 기술적 고민도 하고 있다"고 말했다. 플로는 국내 음원 플랫폼 최초로 AI가 곡 청취 이력과 선호하는 가수·장르·음색 등을 분석해 이용자마다 다른 순위 차트를 제공한다. KT는 음성 검색 '지니보이스'로 노래를 검색하면 목소리와 성별, 나이, 지역 등 이용자 데이터를 기반으로 오디오 콘텐츠를 추천하는 서비스를 기획하고 있다.

일반인 참여도 늘어날 전망이다. 스포티파이는 스마트폰만 있으면 누구나 녹음·편집·스트리밍이 가능한 팟캐스트 제작 도구를 제공한다. 유튜브처럼 영상도 붙일 수 있다. IT 업계 관계자는 "스포티파이는 일반인이 창작에 참여하는 '유튜브식 모델'과 오리지널 콘텐츠로 수익을 내는 '넷플릭스식 모델'을 혼합한 형태"라며 "국내 음원 플랫폼도 스포티파이와 같은 방향으로 발전할 가능성이 높다"고 말했다.

[임영신 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?