엔씨소프트, 캐릭터 음성 자동 제작 AI '멀티버스 TTS' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
㈜엔씨소프트(공동대표 김택진, 박병무, 이하 엔씨(NC))가 게임 음성제작 과정 전반에 활용할 수 있는 AI 모델 'Zero-shot Multi-verse TTS(이하 멀티버스 TTS)'를 8일 공개했다.
TTS(Text to Speech)는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술로, 엔씨(NC)가 이번에 공개한 '멀티버스 TTS'는 3초 분량의 프롬프트 음성만으로도 ▲다양한 발화 스타일 변환 ▲화자 음색 일치도가 높은 교차 언어 생성 ▲다국어 음성 제작이 가능하다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
㈜엔씨소프트(공동대표 김택진, 박병무, 이하 엔씨(NC))가 게임 음성제작 과정 전반에 활용할 수 있는 AI 모델 'Zero-shot Multi-verse TTS(이하 멀티버스 TTS)'를 8일 공개했다.
TTS(Text to Speech)는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술로, 엔씨(NC)가 이번에 공개한 '멀티버스 TTS'는 3초 분량의 프롬프트 음성만으로도 ▲다양한 발화 스타일 변환 ▲화자 음색 일치도가 높은 교차 언어 생성 ▲다국어 음성 제작이 가능하다.
엔씨(NC)는 이 '멀티버스 TTS' 기술을 게임 음성 제작 과정 전반에 활용할 계획이다. 해당 모델을 활용하면 제한된 음성 리소스를 활용해 고품질의 풍부한 AI 캐릭터 보이스 제작이 가능해 기존 음성 작업에 소요되던 시간과 비용을 크게 절감할 수 있다.
또 이 모델이 단일 모델로 구동이 가능한 점도 특징이다. '멀티버스 TTS'는 여러가지 언어와 기능을 가진 TTS를하나의 모델로 제공해 다국어 음성 콘텐츠를 제작한다. 최적화된 하나의 모델을 활용하는 만큼 경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다.
엔씨(NC)는 단일 모델로 다양한 스타일의 언어와 음성을 생성하는 '멀티버스 TTS' 모델 논문을 세계적인 권위를 갖는 인공지능 관련기술 학회 'EMNLP(Empirical Methods in Natural Language Processing)'에 게재하며 글로벌 기술력 입증에도 성공했다.
한편, 현재 엔씨(NC)는 글로벌 게임 출시를 위해 다국어 음성 AI 연구 개발에 매진하고 있다. 이번 '멀티버스 TTS'를 시작으로 연내 100종의 게임 캐릭터 음성을 제작하고, NPC의 성격과 상황에 맞춰 음성을 제작하는 조절 기능을 지속 개발하는 것이 목표다.
사용자 중심의 게임 저널 - 게임동아 (game.donga.com)
Copyright © 게임동아. 무단전재 및 재배포 금지.
- 엔씨-아마존게임즈, 'THRONE AND LIBERTY' 글로벌 출시..'동접 32만 달성'
- 엔씨소프트 '저니 오브 모나크', 24시간 이내 사전예약 100만 돌파
- 엔씨소프트 리니지W ‘실렌의 성소’, 비하인드 스토리&아트 공개
- [롤드컵] "모두를 미치게 하는 4번 시드" T1, 숙적 꺾고 '롤드컵 결승' 진출
- [한주의게임소식] "문 열어, 제발!" 접속 홍역 치른 ‘디아4’ 확장팩
- 슈퍼바이브 새로운 넥슨의 흥행 IP로 떠오를까?
- 그라비티, G-STAR 2024 참가.. 최초 공개 타이틀 포함한 17종 출품작 출격
- [롤드컵] LPL 1번 시드 꺾은 T1 “8강 진출 청신호”
- [한주의게임소식] “아파트를 건 집념이 통했다!” ‘트릭컬’, 매출 TOP 10 진입
- "종이 때문에 그 손가락을 썼어?" '게임 하숙생이 전부 미녀입니다' 논란