'꽥꽥' 소리쳐도 꾀꼬리처럼 들려…악성민원에 질려 개발한 日신기술

이경호 2024. 6. 18. 13:07
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

고함으로 가득찬 악성민원인의 목소리를 듣기 편하게 바꿔주거나 어눌한 영어발음을 유창하게 바꿔주는 기술이 일본에서 개발됐다.

일본 NTT는 17일 "목소리와 말하는 방법을 마음에 드는 스타일로 순식간에 바꾸는 음성변환 기술을 개발했다"고 발표했다.

일본 언론들은 '카스하라'(고객괴롭힘)가 만연한 일본에서 콜센터에서 악성민원인의 목소리를 실시간으로 음성전환해 콜센터 직원이 편한하게 응대할 수 있고 말이 서툰 장애인과의 대화도 쉬워질 것으로 기대했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

일본 NTT 음성변환 기술 개발
음성과 말하는 방법, 맘에 드는 스타일로
언론들 "고성·폭언 많은 콜센터서 필요"
어눌한 영어도 유창하게 바꿔줘
일본 NTT의 기술 상용화하면 악성민원인이 고함을 쳐도 콜센터에서는 음성변환이 이뤄져 듣기 좋은 부드러운 톤으로 바뀌게 된다. 사진은 기사의 이해를 돕기 위한 이미지

고함으로 가득찬 악성민원인의 목소리를 듣기 편하게 바꿔주거나 어눌한 영어발음을 유창하게 바꿔주는 기술이 일본에서 개발됐다.

일본 NTT는 17일 "목소리와 말하는 방법을 마음에 드는 스타일로 순식간에 바꾸는 음성변환 기술을 개발했다"고 발표했다. 이 기술은 대면이나 원격을 불문하고, 다양한 음성 커뮤니케이션에서의 음성 변환을 가능하게 해준다. NTT는 "이 기술은 웹 회의 및 실시간 전송 등에서 실시간 음성 변환이 가능하다"면서 "앞으로는 스마트폰이나 VR 디바이스 상에서의 이용 등 다양한 장면에서의 응용이 기대된다"고 했다. NTT는 오는 24일부터 개최되는 커뮤니케이션 과학 기초 연구소 오픈 하우스 2024에서 선보일 예정이다.

일본 언론들은 '카스하라'(고객괴롭힘)가 만연한 일본에서 콜센터에서 악성민원인의 목소리를 실시간으로 음성전환해 콜센터 직원이 편한하게 응대할 수 있고 말이 서툰 장애인과의 대화도 쉬워질 것으로 기대했다. 또한 영어로 회의나 대화를 할 경우에도 서툰 발음을 원어민에 가깝게 해주거나 긴장해 떨리는 음성도 고쳐줄 수 있다는 것이다.

NTT는 두 가지의 기술적 특징이 있는데 하나는 화자의 음성 특징을 다른 화자의 음성 특징으로 변환해주는 것이고 다른 하나는 저지연 변환 처리라고 말했다. 이는 회의나 대화가 실시간으로 진행되고 있어서 음성변환 시스템을 통해 변환된 음성이 시간이 지연되거나 중간에 끊기지 않고 실시간으로 상대방에게 전달되는 것이다.

일본 소프트뱅크도 최근 인공지능(AI) 기술을 사용해 음성변조전화 기술인 ‘감정 취소’를 개발한 것으로 알려졌다. 홍콩 사우스차이나모닝포스트(SCMP)의 보도를 보면 소프트뱅크 엔지니어인 나카타니 토시유키는 카스하라를 겪는 콜센터 직원을 보호하기 위해 기술을 개발했다. 이 기술은 고함을 지르거나 톤을 높인 발신자의 목소리를 식별해 자연스럽고 차분하게 만든다. 고음의 여성목소리는 톤을 낮추고 위협적으로 들릴 수 있는 남성의 목소리는 부드럽게 바꾸는 것이다.

이경호 기자 gungho@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?