문장 30개로 내 음성과 닮은 인공지능 목소리 만든다
KT는 자신의 육성으로 인공지능(AI) 목소리를 제작할 수 있는 ‘마이AI보이스’ 서비스를 출시한다고 13일 밝혔다.
KT의 AI보이스스튜디오(https://aivoicestudio.ai)가 이날 출시한 마이AI보이스는 30개 예시 문장만 녹음하면 자신의 음성과 닮은 AI 목소리를 만들어 준다. 우리말 뿐만 아니라 영어, 중국어, 일본어, 스페인어 음성도 합성해 만들 수 있다.
앞서 KT는 2019년 300문장을 녹음하면 자신의 육성과 같은 AI 목소리를 만드는 개인화 음성합성(P-TTS)기술이 적용된 ‘내목소리 동화 서비스’를 출시한 바 있다. KT의 AI스피커 기가지니가 사용자의 음성과 닮은 AI 목소리로 아이들에게 동화를 들려주는 서비스다. KT는 개인화 음성합성 기술에 사용하는 문장의 개수를 이번에 10분의 1로 줄이고, 관련 서비스를 날씨안내, 문자·알람 서비스 등으로 확대하기로 했다.
마이AI보이스에는 음성합성 분야 스타트업 휴멜로와 협업한 ‘퓨샷러닝(Few shot learning)’ 기술이 적용됐다. 많은 데이터를 학습할수록 성능이 향상되는 기존의 딥러닝과 달리, 퓨샷러닝은 인간처럼 적은 양의 데이터 자원(Few shot)만 학습해도 AI가 이를 효율적으로 활용할 수 있도록 한 기술이다. KT관계자는 “5분 안팎의 짧은 시간 동안 녹음한 음성 데이터로도 고품질의 AI 보이스를 생성함으로써 제작에 들어가는 비용과 시간을 획기적으로 단축할 수 있다”고 말했다.
앞서 KT는 국방부와 협업해 마이AI보이스 기술을 적용한 AI 서비스를 해외파병 장병 가족들에게 제공했다. 지난 9월 레바논으로 파병된 동명부대 27진 장병들의 음성을 녹음해 AI 목소리로 만든 뒤, 한국에 남아있는 가족들이 이 목소리를 AI스피커 등에 활용하도록 했다.
KT는 대한축구협회, 축구 국가대표팀 공식 서포터즈 ‘붉은악마’와 공동 제작한 2022 카타르 월드컵 공식 응원가 ‘더 뜨겁게, 한국’에도 마이AI보이스 기술을 적용했다. 고 유상철 감독(2021년 6월 작고)의 목소리를 복원해 응원가에 축구 국가대표팀 선수들을 응원하는 내레이션을 담았다. ‘더 뜨겁게, 한국’은 지난 11일 열린 축구 국가대표 평가전(아이슬란드 상대)에서 공개됐다.
최준기 KT AI·빅데이터 사업본부장(상무)은 “KT AI보이스 스튜디오를 통해 AI보이스의 무한한 확장성을 보여줄 것”이라며“KT는 앞으로도 자체 AI 기술 개발과 함께 우수한 기술을 보유한 스타트업과의 협업을 통해 AI 생태계를 계속 확장해 나가겠다”고 말했다.
이재덕 기자 duk@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- “당장 4800만원을 어디서 구합니까”···서민들 ‘날벼락’
- “부부싸움” 농담, “하나만 해” 반말, “무식” 반박…윤 대통령, 125분간 26개의 답변
- ‘충격’ 토트넘, 손흥민에 재계약 불가 통보···1년 연장 옵션이 끝 “태도 바꿨다, SON 측은 충
- [속보] “아내 순진…잠 안 자고 내 폰 봐서 ‘미쳤나’ 그랬다” [대통령 기자회견]
- [단독] 김태열, 대통령 회견에 “명태균, 김건희와 수시로 통화했다고···거짓말 누가 하나”
- 명태균 “정진석·권성동·장제원 누르려고 내가 윤상현 복당시켜”
- “펑! 하더니 사람 떨어져”···부산 빌라 화재, 5층 주민 추락사
- 친한계 “안 하느니만 못해” vs 친윤계 “진솔한 사과”···쪼개진 여당
- “이게 사과냐” “해명은커녕 파국”···윤 대통령 담화에 들끓는 시민사회[대통령 기자회견]
- [속보] 윤 대통령, 무엇에 대한 사과냐 묻자 “구체적 언급 어렵다” [대통령 기자회견]