[스타트업人] ‘AI 성우’ 다듬는 사람, 네오사피엔스 오디오 QA 매니저 이야기

김영우 2023. 8. 2. 13:51
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[IT동아 김영우 기자] ‘스타트업人’은 빠르게 발전하고 성장하는 스타트업 속에서 일하는 사람의 이야기를 담고자 합니다. 정확히는 ‘그들은 무슨 일을 할까?’라는 궁금함을 풀고자 합니다. 많은 IT 기업이 ‘인재’를 채용하기 위해 치열하게 경쟁하고 있다는데, 정작 해당 인재는 그 기업에서 무슨 일을 하는지 궁금하잖아요. 예를 들어, 같은 부서, 같은 직함을 가진 구글의 인재와 페이스북의 인재는 똑같은 일을 하고 있을까요?

김규리 네오사피엔스 오디오 QA 매니저 / 출처=IT동아

이번 스타트업人에서는 기존 음성 합성 서비스의 한계를 넘어, ‘영혼’이 느껴지는 ‘AI 성우’를 지향한다는 '타입캐스트(Typecast)' 서비스를 개발한 기업, '네오사피엔스(Neosapience)'를 살펴봅니다. 글자를 사람의 목소리로 변환하는 서비스는 많지만, 타입캐스트는 마치 진짜 전문 성우처럼 자연스러운 결과물을 기대할 수 있습니다. 특히 감정이나 개성의 표현도 가능하며, 유명인이나 특정 캐릭터의 목소리를 정교하게 재현하는 등, 다양한 활용이 가능합니다.

이런 신기한 기술을 구현하기 위해 네오사피엔스의 사람들은 어떤 노력을 하고 있을까요? 그리고 어떤 사람들이 일하고 있을까요? 김규리 네오사피엔스 오디오 QA(품질검수) 매니저와의 인터뷰를 통해 알아봤습니다.

- 네오사피엔스는 어떤 회사입니까? 합류하게 된 과정도 궁금합니다

: 네오사피엔스라는 회사명은 ‘신인류’를 뜻하며, 주요 서비스는 ‘AI 성우’를 지향하는 ‘타입캐스트’입니다. 말 그대로 정말 영혼까지 담은 자연스럽고 다양한 목소리를 구현하기 위해 노력하고 있습니다.

저는 본래 전자음악을 전공했고 영국에서 4년 넘게 유학을 하기도 했습니다. 음악 외에 언어학도 공부했지요. 그리고 졸업 즈음에 음성 인식 기술 업체에서 일하기도 했는데, 이 과정에서 데이터 관리, AI 학습 후 모델링을 비롯한 기술적인 노하우도 익힐 수 있었죠. 귀국 후 3년여 동안 싱어송라이터로 활동하기도 하고, 영어 강사를 하기도 했습니다.

네오사피엔스에는 재작년 11월에 알게 되어 공채로 지원했습니다. 사운드 관련 지식 외에도 언어에 대한 감각도 필요한 직책이었는데, 예전에 음악과 언어학을 공부한 것이 도움이 되었습니다. 일하게 된 건 작년 3월부터입니다.

- 회사에서 구체적으로 어떤 일을 하나요?

: 타입캐스트 서비스를 위해 국내외 성우들과 접촉해 음성의 기반이 되는 데이터를 수집한 후, 이를 통해 AI가 음성을 학습시키는 모델링 작업을 하게 됩니다. 이렇게 모델링이 끝나면 어떤 단어를 넣어도 그 목소리를 낼 수 있게 되지요.

다양한 개성을 품은 여러 국가의 목소리를 자연스럽게 구현할 수 있는 타입캐스트 / 출처=네오사피엔스

음성 데이터 수집 및 모델링 단계에서 데이터 품질 관리를 하는 것이 저의 주 업무입니다. 다양한 테스트를 통해 문제점을 체크하고, 이를 수정하기 위한 데이터 수집이나 모델링을 반복하게 됩니다.

AI라고 하는 것이 항상 예상대로 결과물이 나오진 않기 때문에 경험에 의존해 결과물을 예측해야 합니다. 그리고 이 과정에서 엔지니어와 많은 의견교환을 하게 되는데, 엔지니어들이 디지털 수치를 변경해가며 작업하는 반면, 결과물인 사운드는 아날로그이기 때문에 양측의 조율을 하는 것이 쉽지 않습니다.

그리고 이런 과정을 거쳐 제품을 출시한 후에도 CX(고객경험)팀에서 고객들의 의견을 받아 지속적인 제품 개선을 합니다. 이 모든 과정에서 가장 중요한 건 ‘소통’입니다. 네오사피엔스는 제품의 용도, 서비스 과정 전반까지 소통으로 시작해 소통으로 끝나는 회사죠.

- 타입캐스트는 주로 어떤 고객이 이용합니까? 대표적인 이용 사례를 소개하자면?

: 가장 많이 접할 수 있는 이용자는 역시 유튜버들입니다. 특히 자신의 모습이나 목소리를 직접 드러내지 않는 유튜버들이 애용합니다. 이를테면 구독자 240만을 보유한 요리 유튜버인 ‘뚝딱이형’ 같은 분이 대표적이죠.

그 외에 CJ나 현대, 롯데를 비롯한 유명 홈쇼핑 업체에서도 타입캐스트를 도입했으며, 한국산업안전보건공단에서도 타입캐스트의 기술을 응용해 이사장의 아바타를 제작한 바 있습니다. 그 외에 이름만 들어도 다 알만한 글로벌 기업에서도 적극적으로 우리의 기술을 활용하고 있습니다. 비즈니스 관계상 모두 공개하지 못하는 것이 아쉽네요.

- 업무를 진행하면서 겪은 어려운 점은 있나요? 있다면 어떻게 극복했나요?

: 타입캐스트는 다양한 언어로 서비스 분야를 확장하고 있습니다. 해외 성우들의 음성 데이터도 수집해야 하는데 시차 등의 원인으로 접촉이 쉽지 않았죠. 그리고 영어 외의 제2 외국어의 경우는 제가 모르는 점이 많고, 미지의 영역을 접하는 것에 다소의 부담도 있었습니다. 물론 이는 회사의 비즈니스 영역이 성장하고 있다는 증거이기도 하죠.

데이터 품질을 체크하고 있는 김규리 매니저 / 출처=IT동아

그리고 제가 맡은 직무는 기술과 비즈니스를 동시에 이해해야 하기 때문에 계속 공부하고 단련해야 한다는 압박감도 느낍니다. 대신 회사의 교육 제도가 잘 되어 있습니다. 최근 교육비를 지원받아 코딩을 배우고 있는데 의외의 재미를 느꼈습니다.

- 네오사피엔스에서 일하면서 가장 좋았던 점은 무엇이었나요?

: 제가 외국 생활을 했기 때문에 전통적이고 수직적인 기업 문화에 적응하지 못할 것을 걱정했습니다. 하지만 네오사피엔스의 사내 분위기는 상당히 자유로운데다 수평적인 구조라 좋았습니다. 각자의 의견을 자유롭게 낼 수 있으며, 다소 특이한 의견이라도 충분한 논리와 이유가 있다면 받아들여지곤 합니다.

이를테면 제가 처음 입사했을 때 제 직책은 ‘사운드 디자이너’ 였는데, 저의 건의를 통해 오디오 QA 매니저로 직책명이 바뀌었습니다. 제 직무는 AI 학습에 문제가 있으면 어느 부분인지를 알아채고 관계자와 의견을 주고받으며 다시 학습을 시키는 과정이 필요합니다. 단순히 음향적인 지식 외에 데이터 관리 능력 및 문제 해결 능력이 필요하기 때문에, 사운드 디자이너라는 이름이 어울리지 않는다고 판단했죠. 새로운 직원을 충원할 경우에도 대비한 것입니다.

- 네오사피엔스에서 일하고자 한다면 어떤 역량이 필요할까요?

: 일단 제가 맡은 부서는 음향적인 지식과 더불어 문제 해결 능력과 소통능력이 중요합니다. 그리고 제2 외국어를 비롯한 다양한 언어를 할 수 있는 분이라면 한층 수월하게 일할 수 있을 거 에요.

휴게실에서 의견을 나누고 있는 네오사피엔스 직원들 / 출처=IT동아

그리고 트렌드를 빠르게 읽을 수 있는 능력, 그리고 실험정신을 가진 분이 네오사피엔스에 적합하다고 생각합니다. 수평적인 기업문화를 가지고 있기 때문에 자신의 아이디어를 바탕으로 새로운 도전을 하는 것도 가능합니다. 물론 자율성이 높은 대신, 결과에 대한 책임도 감수해야겠지요. 사내의 HR 담당자가 결과에 대해 수시로 평가하고 개선해야 할 점도 이야기해 주기 때문에 직무에 최선을 다한다면 큰 문제는 없을 거라고 생각합니다.

- 네오사피엔스에 관심을 가진 구직자들, 업계 관계자들에게 전하고자 하는 메시지가

있다면?

: 스타트업이라고 하여 편견을 가지는 분들도 있겠습니다만, 이미 업계에서 평가도 높고 향후 발전 가능성도 큰 회사라고 생각합니다. 특히 CEO를 비롯한 대부분의 구성원이 개방적인 사고를 가지고 있어 외국계 기업 같은 분위기도 있습니다. 소통과 성장을 즐기는 분이라면 대환영이고요.

AI는 비록 디지털 데이터에 불과합니다만, 우리와 함께한다면 여기에 영혼과 인격을 넣을 수 있습니다. AI에 관심이 있는 분, 음향과 언어에 대한 열정이 있는 분이 우리와 함께했으면 합니다.

글 / IT동아 김영우(pengo@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)

Copyright © IT동아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?