코난테크놀로지, '코난보이스'에 최신 기술 적용.. 외국어 합성도 가능

구자윤 2024. 4. 23. 09:31
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

코난테크놀로지가 인공지능(AI) 음성합성 제작 서비스인 '코난보이스'에 최신 음성기술을 적용했다.

코난보이스는 사용자 목소리를 다양한 언어로 변환할 수 있는 새로운 음성합성 모델을 공개했다고 23일 밝혔다.

서영주 음성그룹 연구소 상무는 "코난보이스 사용자들이 더욱 다양하고 풍부한 콘텐츠를 쉽게 만들 수 있도록 앞으로도 최신 인공지능 음성기술 개발과 고도화에 박차를 가하겠다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

코난테크놀로지, '코난보이스'에 최신 기술 적용..

코난테크놀로지가 인공지능(AI) 음성합성 제작 서비스인 ‘코난보이스’에 최신 음성기술을 적용했다.

코난보이스는 사용자 목소리를 다양한 언어로 변환할 수 있는 새로운 음성합성 모델을 공개했다고 23일 밝혔다.

발음기호를 언어마다 다르게 사용하는 대신 국제음성기호(IPA) 기반의 공통 발음기호를 사용해 한 사람의 목소리로 여러 언어의 음성 합성이 가능한 모델이다. 성우 고유의 억양과 음성 특성은 유지한 채 여러 외국어를 원어민에 가까운 수준으로 충실하게 합성해주며, 별도의 원어민 성우 섭외나 추가 녹음 없이도 여러 언어를 구사할 수 있는 것이 장점이다. 기존 텍스트 기반 음성합성에서 진일보한 시도인 동시에 다국어 음성합성에 대한 고객들의 꾸준한 수요를 반영했다. 현재 한국어 및 영어를 제공하고 있으며 추후 일본어, 중국어 등으로 늘려갈 계획이다.

또한 최신 음성모델의 알고리즘은 기존 대비 크기가 콤팩트해졌으며 효율적으로 음성을 생성해 화자의 표현력을 손실 없이 구현할 수 있게 됐다. Flow 기반의 최신 기법을 적용해 트랜스포머 신경망 모델 대비 연속성이 보강된 원활한 입출력 흐름으로 더 자연스러운 음성을 생성할 수 있게 됐다.

서비스도 업데이트됐다. 1080p FHD 해상도가 추가돼 고화질 영상 제작을 지원하고 자막 서비스가 신설돼 영상 품질과 제작 편의성을 높였다.

서영주 음성그룹 연구소 상무는 “코난보이스 사용자들이 더욱 다양하고 풍부한 콘텐츠를 쉽게 만들 수 있도록 앞으로도 최신 인공지능 음성기술 개발과 고도화에 박차를 가하겠다”고 말했다.

solidkjy@fnnews.com 구자윤 기자

Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?