AI가 노래하고, 한국어로 말하다…수퍼톤, 음성 AI의 경계를 허물다

강일구 기자 2025. 5. 20. 16:12
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AWS 서밋 서울 2025서 ‘듀엣 가창·실시간 더빙·AI 안내 방송’ 등 신기술 공개
이교구 대표 “AI 음성 기술, 콘텐츠 넘어 생활로…대중화 앞장설 것”

(시사저널=강일구 기자)

AI가 직접 노래하고, 외국인의 목소리를 한국어로 더빙해 전달하며, 수백 명의 관람객 앞에서 안내 방송까지 진행했다. '사람의 목소리인가?'라는 의심이 들 정도로 자연스러웠다. 지난 5월 14~15일, 서울 코엑스에서 열린 'AWS 서밋 서울 2025' 현장에서 국내 AI 오디오 기술 기업 수퍼톤이 선보인 실시간 음성 AI 기술에 쏠린 관심은 뜨거웠다.

기술 시연이라기보다, 현실을 넘어선 '체감'에 가까웠다.

지난 14일 'AWS 서밋 서울 2025' 기조연설을 앞두고 펼쳐진 '컨트롤 유' 무대에서 여성 가창자가 수퍼톤이 만든 남성의 AI 보이스와 함께 노래 부르고 있다. (사진 출처: AWS)

"듀엣 무대도 AI가 한다"…완성도 높아 '진짜 사람' 오해도

행사 첫날, 기조연설에 앞서 펼쳐진 'Ctrl+U' 무대는 기술적 쇼케이스 이상의 장면을 연출했다. 이 무대는 포자랩스가 작곡•작사한 AI 음악 'Ctrl+U'에 맞춰 꾸며졌다. 1절에서는 AWS와 딩고뮤직이 공동 기획한 'AI 뮤직 챌린지' 참가자들의 영상이 흐르고, 그 안에 수퍼톤이 제작한 남성 AI 보이스가 코러스에 참여했다. 이어진 2절에서는 여성 가창자와 AI 보이스가 실제로 무대 위에서 함께 듀엣을 완성했다.

현장 반응은 놀라움 그 자체였다. "이게 진짜 AI인가?", "사람 목소리랑 구분이 안 간다"는 관람객 반응이 이어졌다. AI가 단순히 따라 부르는 수준을 넘어, 음색•호흡•감정까지 구현하는 단계로 진입했음을 보여주는 순간이었다.

성두용 수퍼톤 연구개발실장이 지난 15일 서울 코엑스에서 열린 'AWS 서밋 서울 2025' 기조연설에서 발표하고 있다. (사진 출처 : 수퍼톤)

글로벌 발표 영상, AI가 한국어로 '실시간 통역'

둘째 날 기조연설에서는 수퍼톤의 기술력이 보다 직접적으로 드러났다. 버너 보겔스 아마존 CTO와 디팍 싱 AWS 부사장이 영어로 발표한 영상을 수퍼톤이 AI 더빙 기술을 활용해 한국어로 실시간 더빙한 것이다. 기존 더빙과 달리, 원래 화자의 목소리와 억양, 말투를 그대로 유지하면서 한국어로 바꿔 말하는 '보이스 클로닝' 기반 기술이다.

수퍼톤은 사전 녹화된 영어 발표 영상에서 두 인물의 목소리를 추출한 뒤, AI 음성 기술로 이를 한국어로 전환했다. 영상 후반부에 등장한 더빙은 두 연사가 유창한 한국어를 구사하는 듯한 착각을 불러일으켰고, 객석에서는 놀란 탄성이 터져 나왔다.

수퍼톤 성두용 연구개발실장은 이날 무대에서 "'수퍼톤 플레이'는 TTS 기반 AI 음성 서비스로, 다양한 콘텐츠 제작 환경에 실시간으로 적용 가능하다"며 "AI 더빙을 포함한 음성 기술 전반이 크리에이터, 교육, 방송, 광고 등 여러 산업으로 확장될 수 있다"고 강조했다.

안내 방송까지 책임진 AI 음성…"이제는 실생활 기술"

이번 행사에서 수퍼톤 기술은 무대에만 국한되지 않았다. 관람객 입장부터 세션 소개, 퇴장 안내까지 장내 전 영역의 방송 멘트를 수퍼톤의 AI 음성이 맡았다. '에디'와 '수호'라는 이름의 AI 캐릭터 음성을 통해 제공된 이 서비스는, 수퍼톤 플레이의 200여 종 음성 중 안내에 최적화된 톤을 선별한 결과물이다.

현장에서 공개된 AI 음성 답변 서비스 '캐릭터 챗', 골프 코칭 기능이 탑재된 'AI 골프 코치' 등도 기술과 실용성이 결합된 형태로 관람객의 눈길을 끌었다. 특히 골프존 부스와 협업한 AI 골프 코치는, 사용자의 피드백에 실시간으로 반응하며 음성 지도를 제공하는 방식으로 구현됐다.

"AI 오디오, 창작 도구에서 생활 기술로"

이교구 수퍼톤 대표는 "이번 AWS 서밋을 통해 수퍼톤의 기술이 콘텐츠 제작을 넘어 실생활 전반에 적용될 수 있음을 보여줄 수 있었다"며 "앞으로도 AI 음성 기술의 대중화를 선도하며 오디오 산업의 패러다임을 이끌 것"이라고 밝혔다.

수퍼톤은 지난 2월, AI 음성 플랫폼 '수퍼톤 플레이'를 정식 출시했으며, 3개월 만에 전 세계 200여 개국에서 누적 가입자 수 20만 명을 돌파했다. 기술 기반 서비스가 글로벌 시장에서도 빠르게 확장되고 있다는 방증이다.

Copyright © 시사저널. 무단전재 및 재배포 금지.