소리 분석해 사고 막고 품질 검사까지…듣는 AI가 뜬다 [긱스]

김주완 2024. 7. 2. 17:25
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

커지는 소리 관련 AI산업
모바휠, 음파 통해 도로상태 점검
로아스는 음향장비로 불량품 선별
AI 성우 제공하는 네오사피엔스
포자랩스는 1분 만에 음악 생성
클레브레인, 악기 연주 분석
음성 생성 시장, 8년 후 26.6억弗

지난 1월 미국 라스베이거스에서 열린 세계 최대 IT·가전 전시회 CES. 사티아 나델라 마이크로소프트(MS) 최고경영자(CEO)가 이례적으로 한국 스타트업 부스를 찾았다. 오디오 솔루션 기업 가우디오랩의 음향 생성 서비스를 확인하기 위해서였다. 오현오 가우디오랩 대표는 “최근 이미지 생성 서비스는 많이 나왔지만 해외에서도 음향 관련 솔루션은 찾기 어렵다”고 말했다.

이상 소리 감지해 사고 막는다

그래픽=이정희 기자


2일 업계에 따르면 인공지능(AI) 기술의 발달로 소리 관련 비즈니스가 급성장하고 있다. 시장의 주축은 스타트업이다. 음악 생성, 제조 공정 이상 감지, AI 성우 등 분야가 다양해 스타트업이 도전하기 좋은 시장이라는 게 업계의 설명이다.

모바휠은 AI 기반 도로 상태 정보 플랫폼 ‘이지웨이(EG-Way)’를 개발한 업체다. 이 회사는 음파와 AI로 도로의 재질과 상태를 분석해 표면 거칠기를 파악한다. 아무것도 없는 벽과 스펀지가 있는 벽에 반사하는 소리가 다르듯 음파로 노면의 물리적인 성질을 분석한다.

김민현 모바휠 대표는 “미국에선 자동차 미끄러짐으로 발생하는 교통사고가 전체의 20%나 된다”며 “노면을 음파로 분석해 이런 사고를 막을 수 있다”고 설명했다. 모바휠은 최근 연구개발(R&D) 센터를 대전에 새로 구축했다.

로아스도 소리를 분석해 사고를 막는 기술로 유명하다. 이 회사의 전문 분야는 산업 시설이다. 마이크로폰 센서 등 다양한 음향 장비로 확보한 관련 데이터를 AI가 분석한다. 이재현 로아스 대표는 “음향 검사 시스템 ‘AI 스퀘어’는 공장에서 만든 제품의 품질 검사에서 이상 소음을 잡아내 불량 제품을 찾아준다”고 설명했다. 로아스는 LG전자의 공기청정기, 시스템 에어컨 등이 작동하는 소리를 분석해 제품 상태를 확인하고 있다. 앞으로 무인 차량과 드론 등을 활용해 로아스 솔루션의 적용 범위를 늘릴 계획이다.

최근 주목받는 생성 AI 분야에서도 소리를 활용한 기업이 늘고 있다. 가우디오랩은 생성 음성 서비스 개발에 집중하고 있다. 동영상을 입력하면 영상에 어울리는 음향이나 음성을 만드는 기술이다. 오 대표는 “전 세계 오디오 산업에 인재가 별로 없는데 가우디오랩에는 관련 전문가가 많다”고 강조했다. 가우디오랩에는 9명의 음향 공학 박사를 포함해 40여 명의 오디오 전문가가 근무 중이다.

성우도 AI가 대체

‘AI 성우’를 밀고 있는 스타트업도 시장의 주목을 받고 있다. 네오사피엔스의 AI 기반 음성 서비스 타입캐스트가 제공하는 음성 캐릭터는 400종류가 넘는다. 지난해 타입캐스트 누적 가입자는 155만 명을 돌파했다. 세계 70여 개국에서 돈을 내고 이 서비스를 사용하고 있다. 2022년 국내 유튜브 쇼츠(짧은 영상) 부문에서 최다 시청자를 기록한 유튜브 채널 ‘1분요리 뚝딱이형’에 나오는 목소리도 타입캐스트에서 만들었다. 최근 김태수 네오사피엔스 대표는 미국에서 직접 해외 시장을 공략하고 있다.

휴멜로는 AI를 활용해 개인의 목소리를 다양한 방식으로 변조하는 서비스를 제공한다. 이용자가 2분만 목소리를 녹음하면 다양한 형태로 목소리를 변형해준다. 휴멜로는 실제 성우가 녹음한 것과 비슷한 TTS(text to speech·텍스트 음성 변환) 기술도 제공한다.

음악 창작에도 AI가 쓰인다. 포자랩스는 지난 4월 음악 창작 플랫폼 ‘라이브’의 정식 서비스를 시작했다. 라이브는 음악, 가사, 보컬을 한 번에 생성해 누구나 손쉽게 음악을 만들어볼 수 있는 창작 플랫폼이다. 비전문가도 음악의 장르와 분위기를 선택하고 간단한 키워드를 입력하면 1분 안에 음악을 만들 수 있다. 출시 석 달 만에 세계적으로 4만여 명이 5만 곡 이상의 음악을 생성했다.

뉴튠은 5월 음악 생성 서비스 믹스오디오의 모바일 스트리밍 앱 버전을 출시했다. 믹스오디오는 원하는 음악 스타일을 입력하거나 직접 찍은 사진 혹은 이미지를 업로드하면 AI가 관련 음악을 생성하는 서비스다. 5월 기준으로 34만 곡 이상의 음악을 생성했다. 이종필 뉴튠 대표는 “기존 웹 서비스는 저작권 문제가 없는 음원이 필요한 크리에이터 등을 대상으로 제공했고 이번 스트리밍 앱 버전은 일반 사용자에게까지 AI 음악의 효용성을 알리기 위해 내놨다”고 설명했다.

악기 연주·난청도 보조

클레브레인은 악보 플랫폼 ‘피아노키위즈’를 운영한다. 피아노키위즈에선 음표나 박자 난이도, 빠르기와 건반 범위가 표시된 디지털 악보를 거래하고 확인할 수 있다. 소비자가 구매한 악보로 연주하면 AI가 스마트폰이나 태블릿PC의 마이크로 소리를 잡아내 연주가 제대로 이뤄지는지 분석한다. 해당 AI는 5밀리세컨드(㎳·1㎳=1000분의 1초) 내에 88개 건반 중 어떤 건반이 입력됐는지를 알 수 있다고 회사 측은 설명했다. 클레브레인은 올해 기업은행의 창업육성 프로그램인 ‘IBK창공’의 지원 대상에 선정되기도 했다.

엠피웨이브는 청각보조 서비스 ‘클리어센스오디오’의 개발사다. 복잡한 잡음 환경에서도 특정 소리를 제대로 들을 수 있는 기술을 개발했다. 클리어센스오디오는 난청자의 청력 저하 문제를 해결하는 보청기 기능도 제공한다. 클리어센스오디오는 스마트폰과 이어폰으로도 사용할 수 있다. 엠피웨이브의 창업자인 박형민 서강대 전자공학과 교수는 음성 향상과 음성인식 분야의 전문가다. 박 대표는 “세계보건기구(WHO)에 따르면 세계에서 청력 저하를 경험한 사람이 15억 명 정도”라며 청각 보조 서비스 시장의 성장 가능성이 크다고 강조했다.

AI 기반 소리 관련 산업의 전망은 밝다. 글자, 이미지 생성 서비스가 인기를 끌면서 음성 관련 솔루션의 수요도 커졌기 때문이다. 시장조사업체 마켓닷어스는 글로벌 음원 생성 시장 규모가 2022년 2억2900만달러(약 3157억원)에서 2032년 26억6000만달러(약 3조6761억원)로 10년 동안 열 배 이상 성장할 것으로 전망했다. 업계 관계자는 “소리 생성 서비스는 저작권 문제, 해외 서비스와 경쟁 등의 부담도 커질 것”이라고 지적했다.

김주완 기자 kjwan@hankyung.com

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?