주동원 대표 “고인의 목소리, AI 가수 등 음성 생성AI 시장 확대될 것”
영상·음성·텍스트 등 생성AI에서 기술력 확보
‘기업 고유 목소리’ 만들어내는 프로젝트 성공적 경험
성경 낭송 등 AI 활용한 다양한 서비스 플랫폼
올해 115억원 매출 목표…2024년 IPO 조준
[이데일리 김영환 기자] 지난해 고 송해 씨가 한 여행플랫폼 광고에 출연한 영상이 화제였다. 고 송씨가 생전에 34년간 진행했던 KBS ‘전국노래자랑’의 오프닝 멘트인 “전국~”으로 시작하는 광고는 고 송씨를 기억하는 많은 사람들에게 또 다른 추억을 선사했다.
당시 광고에서 고인의 생전 목소리를 인공지능(AI) 기술을 이용해 복원시킨 곳이 바로 자이냅스다. 이 회사는 맞춤형 AI 가상 음성 콘텐츠(customized AI virtual voice content)를 만들 수 있는 기술이 강점이다.
오픈AI의 챗GPT가 AI 기술 시장에 큰 충격을 준 것은 기존의 텍스트가 아닌 대화를 통해 정보습득을 할 수 있어서다. 대화처럼 ‘소리’가 대세인 시대가 온다면 사람마다 모두 다른 ‘음색’을 활용한 기술은 또 다른 시장을 열 수 있을 것으로 보인다.
최근 서울 강남구 역삼동 자이냅스 본사에서 만난 주동원 대표는 보다 다양하게 오디오 생성AI의 가능성을 찾고 있다. 기업공개(IPO)를 준비하고 있는 것도 오디오 생성AI 분야가 시장을 형성할 수 있을 만큼 무르익었다는 판단에서다.
기업 입장에서도 오디오 생성AI 시대에서는 기업 고유의 목소리를 찾아야 할 필요가 생긴다. 현재 기업 이미지 광고에는 성우가 녹음을 하지만 변별력이 크지 않다. 초 단위의 특정 멜로디로 기업을 각인시키는 ‘징글’처럼 목소리만으로 기업을 알릴 수 있는 오디오 생성AI에 기업들의 소구가 있다.
주 대표는 “지난해 이전까지만 해도 음성 생성AI에 많은 비용이 필요했지만 작년 하반기부터는 내부적으로 기술력이 올라가면서 비용이 낮아졌다”며 “음성 엔진만 해도 굉장히 고도화된 모델이 4~5개가 별도로 있다. 높은 수준의 음성 생성을 빠르고 저렴하게 만들어낼 수 있는 능력을 보유하고 있다”고 자신했다.
예컨대 여러 목소리를 하나로 융합해 다양한 특징이 담긴 새로운 목소리를 생성하는 기술을 갖고 있다. 삼성전자 임직원 2000명의 목소리를 하나로 합쳐 그들만의 특성을 담은 목소리를 만들어냈다. 초록우산 어린이재단의 캠페인 영상에서 100명의 아이들 목소리를 하나로 합친 것도 자이냅스의 작품이다.
AI 오디오 성경 인기…AI 가수 등 영역 확대
최근에는 ‘바이블리’라는 AI 오디오 성경 서비스에 기대를 걸고 있다.
주 대표는 “목사님 목소리로 읽어주는 성경을 만들고 이걸 유튜브에 올렸는데 누적 조회수가 무려 350만건에 달했다”라며 “시장 조사를 해봤더니 앱스토어의 글로벌 유료 애플리케이션 10개 중 4개가 성경 관련 앱으로 시장성은 충분히 확인했다”고 강조했다.
130만자로 이뤄진 성경을 통독하기 위해서는 80시간 가량 소요된다. 이 서비스를 제공하기 위해 사람이 3박 4일을 꼬박 성경을 읽을 수는 없는 노릇이다.
그는 “30분간 45문장을 읽으면 AI가 학습해 목소리를 재현한다”며 “이 기술을 활용하면 적용할 수 있는 분야가 무궁무진하다”고 기대했다. 지난 2월 현재 국내 122개 교회와 파트너십을 맺었다. 속한 교인만 100만명에 육박한다.
적용할 수 있는 분야도 다양하다. 고인의 목소리를 활용해 유족들이 고인을 언제나 기억할 수 있도록 메시지를 만들 수도 있다. 세상에 없는 목소리를 만들어 AI 가수로 데뷔시킬 수도 있다. 이미 ‘아티’라는 AI 가수가 음원을 내기도 했다.
자이냅스는 지속적인 성장세를 바탕으로 내년 하반기에 IPO를 한다는 계획이다. 이를 위해 최근 NH투자증권과 IPO를 위한 대표 주관 계약을 체결했다.
자이냅스는 현재 공간정보플랫폼 기업 넥스트스토리를 비롯해 기독교 맞춤형 콘텐츠 및 서비스 제공 기업 보이셀라, 모빌리티 플랫폼 기업 웨이버스, 제주지역 특성화 콘텐츠 적용 프로젝트 기업 엑스엔제주 등을 자회사 및 관계사로 갖고 있다. 지난해 매출(연결기준)은 57억원 수준이다.
주 대표는 “올해는 작년보다 2배 늘어난 115억원의 매출을 목표로 하고 있다”며 “향후 온라인 콘텐츠 90%는 생성AI로 만들어질 것이라는 관측이 높다. 우리가 갖고 있는 기술들은 모두 요소 기술(사용자나 문화의 능력을 변화시키고 발현할 수 있는 발명이나 혁신)”이라고 설명했다.
자이냅스는 베트남에도 법인을 세워 교육용 AI오디오북 제작에 뛰어들었다. 모두 생성AI를 접목해 시장성을 높일 수 있는 분야다.
생성AI 분야 중 오디오에 강점을 갖고 있지만 텍스트와 영상 분야에서도 기술 개발에 나서고 있다. 한국어 특성을 반영한 방식 기반과 딥러닝 방식을 결합해 자연어 이해(NLU) 기술을 활용한 최적의 답변을 제공한다.
예컨대 사진에 가이드영상 움직임을 전이해 움직이는 초상화를 제작하면 음성과 결합해 말하는 영상 제작이 가능하다. 단 한 장의 사진으로 말하는 영상을 만들어낼 수 있다. 딥페이크나 버츄어 휴먼과는 다른 생성AI 기술로 제작기간이 짧고 비용이 적게 드는 것이 장점이다.
주 대표는 “지금까지는 AI 기술로 수익을 창출하기에는 부족한 점이 많았다”며 “자사 솔루션을 통해 다른 사업영역으로 확대적용할 수 있다는 자신이 생겼다”고 말했다. 이어 “포스트 코로나 시대를 맞아 현실세계 강화, 모빌리티, 로봇, 교육 분야에서 다양한 사업을 진행하려고 한다”고 덧붙였다.
그러면서 “온라인 콘텐츠의 90%가 생성AI로 만들어지면 다양한 스트리밍 시장이 우리의 시장이 될 수 있다”라며 “텍스트가 아닌 음성으로 콘트롤 하는 시대가 극단적으로 오게 될 것”이라고 내다봤다.
김영환 (kyh1030@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
- ‘민주당 전대 돈봉투’ 수사 급물살…검찰-송영길 신경전 ‘팽팽’
- 英 해설가, 손흥민 향한 인종차별 논란... 반칙 장면 무술에 빗대
- “갑자기 화나”…컵라면 먹던 초등생에 흉기 휘두른 고교생
- “이 맥주 많이 먹었는데”…식약처 ‘전량 회수’ 조치 왜?
- ‘남자한테 몸파는 놈이' 한마디가 부른 살해[그해 오늘]
- 임창정, 라덕연 주최 행사서 "번 돈 모두 라덕연에 줘" 축사
- “더는 못 참아”…박은빈 드라마 촬영장에 벽돌 던진 40대
- 성추행 부인하던 男아이돌, 돌연 “혐의 인정”…징역 10개월
- ‘성+인물 : 일본편’은 시기상조였나 [B딱한 시선]
- 후임 체모 가위로 자른 말년 병장…결국 '성범죄 전과자' 됐다