[AI혁명]③가상인간 목소리에 감정을 입힌다…네오사피엔스

최동현 2023. 3. 23. 07:59
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

김태수 네오사피엔스 대표가 창업한 네오사피엔스
텍스트를 사람 감정이 실린 음성으로 변환…가상인간으로 구현
'AI 주현영' 등 유명인과 협업…게임·기업·관공서 등 활용
"챗GPT 등 생성형 AI와 결합해 시너지"
김태수 네오사피엔스 대표.

유튜브에 '1분요리 뚝딱이형'이라는 채널이 있다. 경상도 사투리를 쓰는 삼촌이 초등학생 조카와 대화하며 요리법을 소개한다. 2021년부터 지난해까지 2년 연속 국내 유튜브 쇼츠 조회수 1위를 차지할 정도로 인기를 끌고있다. 구독자는 226만명에 달한다. 그런데 이 채널에 등장하는 두 인물의 목소리가 실제 사람이 아닌 인공지능(AI)으로 만들어졌다는 사실을 아는 이는 많지 않다. AI 음성 정도는 쉽게 파악할 수 있을거라 자신해온 사람들조차 채널을 구독한 한참 뒤에야 가상 목소리인 걸 알았다며 허탈해 할 정도다.

음성에 인간의 감정 입히는 네오사피엔스

이 유튜브 채널 주인공의 목소리를 구현한 업체가 네오사피엔스다. 네오사피엔스는 AI 음성생성 기술로 텍스트를 오디오로 변환해주는 '타입캐스트'를 서비스중이다. 네오사피엔스가 타 업체와 다른 점은 단순 기계적 변환이 아닌 음성에 사람의 감정을 입힌다는 것이다. 가령 '안녕하세요'라는 텍스트에 '기쁘게', '속삭이듯', '비아냥거리듯' 등의 감정을 선택해 원하는 음성을 얻을 수 있다. 여기에 AI 가상 연기자를 활용해 영상 콘텐츠까지 제작 가능하다.

네오사피엔스가 인공지능(AI) 스타트업 3곳과 협업해 만든 'AI 주현영'.(사진출처=타입캐스트 유튜브 캡처)

네오사피엔스는 지난해 AI 스타트업 3곳과 협업해 'AI 주현영'을 선보여 큰 화제를 불러일으켰다. 주현영은 쿠팡플레이 'SNL 코리아'에서 '주기자', 'MZ오피스' 등 다양한 코너로 인기를 얻은 이른바 MZ세대(밀레니얼+Z세대) 대세 배우다. AI 주현영은 실제 주현영의 외모와 말투를 그대로 닮은 챗봇으로 실시간 의사소통이 가능하다. 기업이나 관공서의 보도자료를 입력하면 주현영 특유의 유머스럽고 발랄한 말투로 읽어주기도 한다.

타입캐스트 가입자는 이달 기준 140만명이다. 76개국에서 유료서비스를 이용중이다. 타입캐스트에 등록된 가상 연기자 캐릭터는 370여종이다. 기업이나 관공서 뿐 아니라 온라인상에서 이른바 '부캐'(부캐릭터)를 만들어 제2의 삶을 살고자 하는 이들에게도 높은 인기를 얻고있다.

챗GPT가 가져올 변화 기대
네오사피엔스가 지난달 16일부터 자사 유튜브 채널에 서비스중인 아바타 카밀라. 카밀라는 네오사피엔스의 가상인간 기술과 챗GPT를 연동한 아바타로 사용자들과 실시간으로 소통하며 24시간 라이브 방송을 하고있다.(사진출처=타입캐스트 유튜브 캡처)

네오사피엔스는 챗GPT와 같은 생성형 AI 열풍이 불러올 변화를 가장 반기는 기업 중 하나다. 생성형 AI가 네오사피엔스 서비스와 결합하면 활용 가능성이 무궁무진하기 때문이다.

네오사피엔스는 지난달 16일부터 유튜브 채널에 챗GPT 서비스를 연동해 실시간으로 반응하는 아바타 '카밀라'를 서비스중이다. 카밀라는 일종의 가상 유튜버로 원하는 음악을 틀어주거나 각종 질문에 실시간으로 대답하는 24시간 상담방송을 진행하고 있다. 챗GPT가 네오사피엔스의 음성기술과 결합한 첫 서비스인 셈이다. 김태수 네오사피엔스 대표는 "음성 생성 기술은 약 4년 전부터 딥러닝을 사용하면서 비약적으로 발전했다"면서 "생성형 AI는 음성과 영상뿐 아니라 아바타 합성기술로 사람의 얼굴표정과 제스처를 생성하는 가상인간 등의 영역에서 혁신을 일으킬 것"이라고 기대했다.

"가상인간의 대중화, 머지않았다"
김태수 네오사피엔스 대표.

네오사피엔스는 김 대표가 2017년 11월 설립한 회사다. 김 대표는 카이스트 대학원 시절부터 머신러닝을 이용한 음성·멀티미디어 신호처리를 전공했다. LG전자와 퀄컴 등의 기업연구소에서 10년 이상 음성인식·음질향상·소리인식 등의 기술을 활용한 제품을 개발했다.

회사 설립 당시 직원은 단 2명이었으나 현재는 60여명이 근무하는 회사로 성장했다. 지난해 시리즈B 투자를 마무리지었다. 현재까지 누적 투자액은 318억원이다. 미국 실리콘밸리의 투자사 블루런벤처스의 아시아 지역 성장 투자 플랫폼 BRV를 비롯해 우리기술투자, 컴퍼니케이, 알바트로스 등이 투자에 참여했다.

네오사피엔스는 올해 해외시장 공략에도 적극 나설 계획이다. 타입캐스트는 현재 한국어 300개, 영어 100개의 목소리를 보유하고 있다. 일본어와 스페인어 등도 서비스중이다. 올해 중국어, 독일어, 이탈리아어, 포르투갈어 등을 론칭하며 사용자를 넓힐 계획이다. 김 대표는 "네오사피엔스는 사람처럼 보고 듣는 것을 넘어 말하고 행동할 수 있는 인공지능 가상인간이 대중화 될 것을 예상해 만든 회사"라고 말했다. "사람처럼 자연스럽게 감정을 표현하고 교류할 수 있는 인공지능을 각종 미디어 뿐 아니라 우리 생활 어디서든 접할 수 있는 미래를 만들겠다”는 것이다.

최동현 기자 nell@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?