“‘1분요리 뚝딱이형’ 음성 생성 기술로 구현한 AI 성우죠” [세계로 뛰는 중소기업]

이지민 2023. 8. 3. 21:11
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

‘네오사피엔스’ 김태수 대표
대본만 넣으면 감정·연령별 목소리 구현
카이스트 석박사 과정으로 ‘음성·AI’ 연구
최근 유튜브 콘텐츠 등 폭넓게 활용 성장
기업 수요도 폭발적… 고객 1000곳 넘어
챗GPT 열풍 ‘영상 콘텐츠’ 시장까지 영향
美 시장 진출 염두 2020년 법인까지 설립
연내 포르투갈어·중국어까지 선보일 예정
“전 세계가 타입캐스트로 창의성 발휘하길”

지난해 구글 유튜브 공식채널에서 국내 인기 동영상 1위를 한 쇼츠는 ‘1분요리 뚝딱이형’의 영상이었다. 영상에는 평범한 남성(뚝딱이형)과 초등학생 남자아이가 빠르고 쉽게 요리법을 알려준다. 뚝딱이형의 정감 가는 경상도 사투리와 천진한 말투의 아이 내레이션이 귀를 잡아끈다. 사람 한 명 등장하지 않는 이 채널은 운영 2년을 갓 넘긴 현재 구독자 245만명을 돌파했다.

뚝딱이형과 아이 내레이션은 사실 크리에이터 본인 목소리가 아니다. 목소리의 주인공은 네오사피엔스의 타입캐스트 서비스가 구현한 인공지능(AI) 성우다. 지난 1일 서울 강남구 사무실에서 만난 김태수 네오사피엔스 대표는 “뚝딱이형은 타입캐스트 서비스를 이용하는 150만명 중 한 명”이라고 소개했다.
김태수 네오사피엔스 대표가 지난 1일 서울 강남구 사무실 타입캐스트 현판 앞에서 포즈를 취하고 있다. 타입캐스트는 인공지능(AI) 음성 생성 기술로 음성 및 영상 제작 서비스를 제공한다. 최상수 기자
타입캐스트는 AI 음성 생성 기술로 텍스트를 오디오로 변환해 준다. 대본만 입력하면 슬픈 목소리, 할머니 목소리와 같은 감정·성별·연령 등을 선택해 음성을 입힐 수 있다. 목소리 종류는 400개에 달한다. 400명의 성우를 보유한 것과 마찬가지인 셈이다. 최근 유튜브 쇼츠 영상에서 여성의 화난 목소리로 유명한 ‘내하루’도 타입캐스트를 활용한 것이다. 해당 채널의 구독자는 23만명인데 불과 2∼3주 만에 구독자가 확 늘어난 사례라고 김 대표는 설명했다.

기업에서도 수요가 폭발적이다. 현재 기업 고객은 1000곳이 넘는다. 김 대표는 “기업에서 너도나도 유튜브 채널을 만드는데 단시간에 20만∼30만 구독자로 성장할 수 있다면 (타입캐스트) 서비스를 이용하지 않을 이유가 없을 것”이라고 했다.

2017년 11월 네오사피엔스를 창업한 김 대표는 LG전자와 미국 반도체·통신장비업체 퀄컴을 거친 엔지니어 출신이다. LG전자에서는 여러 사람의 목소리 중 특정인의 임원을 분리하는 기술을 개발해 논문을 냈다. 입사 전에는 카이스트 석박사 과정으로 음성과 AI 학습 알고리즘을 연구했다.

김 대표는 “대학원이나 이전 기업에서 기술 개발을 할 때는 ‘이런 걸 누가 쓸까’ 생각했는데 5년, 10년이 지나니 많은 사람이 쓰고 있었다”며 창업 배경을 설명했다. 이어 “팀을 만들어 5년, 10년 뒤에 누구든 당연하게 쓰는 기술을 만들어내고 싶었다”고 부연했다.
김태수 네오사피엔스 대표. 최상수 기자
과정이 순탄치만은 않았다. 2019년 11월 정식 서비스 때까지 주변의 의심 어린 눈초리를 견뎌야 했다. 김 대표는 “창업 뒤 1년 넘게 사람들이 진정 필요로 하는 기술을 개발하는 데 집중했다”며 “4년 전만 해도 ‘왜 콘텐츠냐’는 질문을 많이 받았다”고 했다. AI를 이용한 공장 자동화 등에 더 많은 관심이 쏠리는 시기였기 때문이다.

기술과 시장성을 믿어준 투자자를 만난 기쁨은 그래서 더 컸다. 네오사피엔스는 2018년 프리 시리즈A, 2020년 시리즈A, 2022년 시리즈B 투자 유치에 성공해 누적 투자금 318억원을 달성했다.

네오사피엔스의 직원 수는 총 65명이다. 김 대표는 올해 초 이들과 함께 세운 목표는 지난해 대비 매출액, 사용자 수 모두 3배 이상 성장하는 것이다. 김 대표는 “직원 20∼30명 정도의 스타트업이라면 지금 매출액 수준에 문제가 없겠지만 더 큰 시장을 노리고 있어 스케일업(기업 규모 확장)이 필요한 상황”이라며 “사용자가 늘어나 누가 봐도 믿어주는 서비스가 되어야 할 것”이라고 밝혔다.

김 대표는 챗GPT 열풍에 시장이 더 커졌다고 진단했다. 음성·영상 콘텐츠 모두 바탕은 대본인데 챗GPT로 텍스트 콘텐츠를 무한 생산할 수 있는 시대가 됐기 때문이다.
김태수 네오사피엔스 대표. 최상수 기자
해외 수요도 늘고 있다. 이용자 150만명 중 내국인 비중이 더 크지만, 접속 트래픽은 국내와 해외가 각각 40%, 60%일 정도로 해외 비중이 크다. 처음 사이트를 방문하는 사용자들은 해외가 더 많다는 의미다.

김 대표는 미국 시장 확대를 염두에 두고 2020년 미국 법인을 설립했다. AI 성우 목소리도 영어로 100종류에 달한다. 최근에는 스페인어, 일본어, 독일어를 출시했다. 올해 안에 포르투갈어, 이탈리아어, 프랑스어, 중국어까지 선보일 예정이다.

네오사피엔스는 2020년 2월 MBC 특집 VR휴먼다큐 ‘너를 만났다’ 프로젝트를 포함해 여러 번 사회적 이목을 끈 순간이 있었다. 당시 프로젝트에서는 희소병을 앓고 세상을 떠난 나연이의 목소리를 구현했다. 기술이 마음을 치유할 수 있다는 사실을 알린 단적인 예였다.

김 대표가 꼽은 가장 보람된 순간은 역설적이게도 이용자들의 항의 문의를 받을 때다. 그는 “가끔 ‘회사에서 바로 콘텐츠 만들어야 하는데 로그인이 안 된다’는 급박한 문의가 혼다”며 “그만큼 소비자들이 꼭 필요가 서비스라고 생각하는 거라서 책임감이 크게 느껴진다”고 했다. 써도 그만, 안 써도 그만인 서비스라면 서비스 업그레이드 요청 등 여러 불만도 뒤따라오지 않을 것이다. 전 국민이 쓰는 카카오톡이 5분만 멈춰도 뉴스가 되는 것과 일맥상통한다.

김 대표는 “전 세계 누구든 타입캐스트로 자신의 창의성을 발휘할 수 있도록 하는 게 목표”라며 “그때가 되면 기업에서 쓰는 PPT, 워드 파일 등이 모두 타입캐스트를 적용한 영상으로 바뀌고, 일하는 방식과 일상이 바뀔 것”이라고 강조했다.

이지민 기자 aaaa3469@segye.com

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?