“파병 간 아빠 목소리 들려요”…오디오 콘텐츠 노린 KT의 ‘승부수’

김대영 매경닷컴 기자(kdy7118@mk.co.kr) 2023. 6. 11. 13:39
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KT, AI 음성 서비스 본격화
오디오 콘텐츠 시장 공략 박차
110개 AI음성, B2B·B2C 조준
오디오북·유튜버 등 활용 기대
지자체·관광 분야 협업도 추진
파병을 간 장병의 인공지능(AI) 음성이 KT 인공지능(AI) 스피커 ‘기가지니’를 통해 실시간 날씨를 안내하고 있다. 아직 상용화되지는 않았지만 이같은 형태로 AI 음성 서비스를 확장하겠다는 것이 KT의 계획이다. [사진 출처 = KT 홍보영상 갈무리]
파병 장병의 몸은 타지에 있지만 목소리는 가족 곁에 남았다. 문장 30개만 녹음하면 목소리를 똑같이 구현해 내는 인공지능(AI) 음성을 활용한 덕이다. 어린 자녀들은 파병 간 아버지의 목소리로 동화책을 들으면서 잠들 수 있다.

KT는 전문적 기술이 없는 일반 사람들도 자신만의 AI 음성을 제작할 수 있는 ‘마이 AI보이스’를 내놨다. 국내에서 이같은 서비스를 상용화한 것은 KT가 처음이다.

이전에도 텍스트를 음성으로 변환하는 서비스가 없지는 않았다. 마이 AI보이스의 가장 큰 차이점은 이용자 본인 목소리로 음성 변환이 가능하다는 것이다. 예시로 주어진 문장 30개를 직접 읽고 녹음한 다음 하루 정도 지나면 자신만의 AI 음성을 이용할 수 있다.

굳이 자신의 음성을 활용할 필요가 없을 경우에는 KT에서 제공하는 AI 음성 110개를 활용해도 된다.

영상 크리에이터들은 외국어 변환 기능으로 더 많은 시청자들에게 다가갈 수 있다. AI보이스 스튜디오는 한국어를 포함해 영어·일본어·중국어·스페인어 등 총 5개 국어 서비스를 제공한다. 영어를 못하더라도 자신이 직접 영어로 말하는 것처럼 영상을 제작할 수 있는 것이다.

KT는 일단 오디오북과 동영상 크리에이터 시장을 노리고 있다.

노진우 KT AI스튜디오사업팀 팀장은 지난 9일 기자들과 만난 자리에서 “오디오 콘텐츠 시장을 타깃으로 삼았는데 이 시장에서 가장 큰 양대 축이 오디오북과 크리에이터”라며 “오디오북 시장은 올해 500억원 규모의 시장으로 추정되고 크리에이터 시장은 훨씬 더 큰 몇 천억에서 조 단위까지 가는 시장으로 예상했다”고 말했다.

그러면서 “그 정도의 시장 규모 안에서 저희가 (오디오 콘텐츠 시장을) 늘려나가면 충분히 수백억 정도까지는 오디오 콘텐츠 플랫폼 시장 규모가 확장되지 않을까라는 기대를 하고 있다”고 했다.

마이 AI보이스는 가격이 다소 비싸게 느껴질 수 있다. 마이 AI보이스 1개를 이용하는 데 드는 비용은 1인당 9만9000원이다.

별도 요금제를 이용하면 더 유용하게 활용할 수 있다. 유료 요금제 3종은 ▲라이트 ▲슈퍼 ▲슈퍼 플러스 등이다. 유료 요금제는 마이 AI보이스로도 콘텐츠를 제작할 수 있는 서비스를 함께 제공한다.

무료 버전은 AI 음성 110개로 월 4000자를 이용할 수 있다. 유료 요금제의 경우 제공량은 월 2만4000~36만자다.

무료 버전은 감정 더빙을 쓸 수 없다. 유료 요금제만 감정 더빙 기능을 사용할 수 있다. 감정 더빙은 ▲즐거움 ▲침착함 ▲중립 ▲슬픔 ▲화남 등 5가지 감정으로 AI 음성 110개를 합성해 제작하는 기능을 말한다. 말하는 속도와 목소리의 높낮이도 설정할 수 있다.

KT 권진조 AI스튜디오사업팀 과장(왼쪽)과 노진우 AI스튜디오사업팀 팀장이 지난 9일 오후 KT 송파사옥에서 기자들과 만나 AI보이스 스튜디오 서비스에 대해 설명하고 있다. [사진 출처 = KT]
B2B 영역에서도 활용 가능성이 크다. 이미 국내 최대 독서 플랫폼 ‘밀리의서재’와 함께 AI 음성으로 오디오북 4종을 제작하기도 했다. 이 오디오북에는 MBC 아나운서 목소리가 쓰였다. KT는 앞서 MBC 아나운서 17명의 AI 음성 제작을 마쳤다. 다만, 아나운서 등 샐럽들의 목소리는 B2C용으로 제공하지 않는다.

AI 음성을 활용하면서 오디오북 제작 비용과 기간이 크게 줄었다. 성우가 오디오북 1권을 제작하려면 하루 8시간 작업을 기준으로 통상 1주일 정도가 걸린다. 후편집 등을 거쳐 최종 완독본을 만들어내야 하는 점을 고려하면 제작 기간은 더 길어진다. KT 플랫폼을 활용할 경우 소설 1권 완독본을 제작하는 데 약 5시간이면 충분하다.

실제 밀리의서재는 오디오북 제작 비용을 3분의 1 수준으로 절감할 수 있게 됐다.

박물관·전시관·미술관 등에서는 AI 도슨트로도 활용 가능하다. KT의 조경 공간인 ‘디지코가든’을 걷다 보면 10종 이상의 수목에서 김대호 아나운서의 AI 음성으로 설명을 들을 수 있다.

지자체와도 협업을 추진 중이다. 노 팀장은 “지자체와 협업하고 있지만 아직 특정해서 공개할 수는 없다”며 “빠르면 여름 중에 관광 분야에서 서비스를 선보일 수도 있다”고 귀띔했다.

KT는 집안에 있는 AI 스피커 ‘기가지니’에 적용한 서비스도 기획 중이다. 기가지니와 오디오북을 결합한 형태의 서비스를 구상하고 있다는 설명이다. 기가지니와 지니뮤직을 연동해 원하는 음악을 들을 수 있는 서비스와 유사한 형태일 것으로 예상된다.

또 현재 기가지니를 통해 알림이나 날씨 안내 기능을 이용하는 것처럼 본인이나 특정 인물의 목소리를 딴 AI 음성으로 같은 서비스를 제공하겠다는 계획도 밝혔다.

노 팀장은 “AI라고 하면 어색하고 딱딱할 수 있는데 인간과 매우 유사한 로봇을 볼 때 느끼는 불안감을 뜻하는 ‘불안한 골짜기’는 넘어섰다고 생각한다”며 “AI 보이스가 일상에서 지하철 안내뿐만 아니라 다양한 곳에서 활용될 수 있을 것으로 예상하고 시장이 커지면서 보이스 스튜디오가 대표 오디오 플랫폼이 되길 바란다”고 했다.

권진조 KT AI스튜디오사업팀 과장은 같은 자리에서 “유명인이 참여해 AI 장벽을 낮추고 실제 오디오북이나 도슨트 등 공공기관에서 쓰이는 여러 서비스에서 KT의 아나운서 보이스가 많이 쓰이면 좋겠다”고 말했다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?