셀바스AI, 감정 있는 '대화형 음성합성 오픈소스 플랫폼' 구축

김민선 기자 2021. 1. 7. 17:19
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 전문기업 셀바스AI가 로봇의 감정과 개성을 표현할 수 있는 '대화형 음성합성 오픈소스 플랫폼'을 구축했다고 7일 밝혔다.

해당 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로, 한국과학기술원 주관으로 진행된 '음원 다양화를 통하여 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발' 국책 연구과제의 결과물이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

음성 데이터베이스 구축에 대학들 참여

(지디넷코리아=김민선 기자)인공지능(AI) 전문기업 셀바스AI가 로봇의 감정과 개성을 표현할 수 있는 '대화형 음성합성 오픈소스 플랫폼'을 구축했다고 7일 밝혔다.

해당 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로, 한국과학기술원 주관으로 진행된 '음원 다양화를 통하여 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발' 국책 연구과제의 결과물이다.

이 플랫폼은 소스코드 공유사이트 '깃허브'에 구축됐다. 여기에 탑재된 기능으로는 ▲딥뉴럴네트워크(DNN) 음성합성기 제작에 필요한 음성코퍼스 ▲로봇에 감정과 개성을 부여하기 위한 감정적 SSML 해석기 ▲딥러닝 기반 한국어 G2P 변환기 ▲딥러닝 훈련이 가능한 종단간 한국어 음성합성기 ▲음색과 감정을 표현할 수 있는 음성합성기 등이다. 또한 가창 기반 음성합성기 연구를 위해 수집한 한국어와 영어 각각 50개로 구성된 어린이 노래 코퍼스도 공개됐다.

셀바스 AI 대화형 음성합성 오픈소스 플랫폼

해당 플랫폼은 개발에는 한국과학기술원, 성신여대, 대전대학교, 서강대학교 등 대학들도 참여했다. 셀바스 AI는 연구과제 중 DNN 음성합성기 제작에 필요한 음성코퍼스 설계 및 구축을 담당해 총 40명의 목소리로 이루어진 2만4천247개 문장, 34시간 분량의 음성 데이터베이스를 구축했다. 여기에는 감정과 개성 표현을 위한 음성 데이터가 포함되었다.

셀바스AI 측은 "공개된 음성 데이터베이스는 한국어로는 전 세계에서 가장 많은 양의 음성합성용 데이터"라고 설명했다.

김민선 기자(yoyoma@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?