솔트룩스, 기업 위한 음성인식·합성 제품 출시

박진영 2022. 8. 17. 16:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

주로 대기업 위주로 운영되던 AI 컨택센터와 인바운드 음성봇 등이 소상공인 사업장으로도 빠르게 확산되고 있는 가운데 음성명령으로 제어할 수 있는 가전제품들도 다양하게 출시되고 있다.

우수한 음성인식·합성 기술과 편리한 관리 도구를 탑재한 보이스 스튜디오는 음성 기술이 필요한 기업뿐 아니라 콘텐츠를 제작하는 미디어 및 엔터테인먼트 분야에서도 널리 활용될 수 있다는 것이 회사 측의 설명이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

내년 중 클라우드 기반으로 B2C 대상으로도 확대

[아이뉴스24 박진영 기자] 주로 대기업 위주로 운영되던 AI 컨택센터와 인바운드 음성봇 등이 소상공인 사업장으로도 빠르게 확산되고 있는 가운데 음성명령으로 제어할 수 있는 가전제품들도 다양하게 출시되고 있다.

보이스 스튜디오 출시 홍보 이미지 [사진=솔트룩스]

이에 솔트룩스(대표 이경일)는 신제품 '보이스 스튜디오(Voice Studio)'를 출시했다고 17일 발표했다.

우수한 음성인식·합성 기술과 편리한 관리 도구를 탑재한 보이스 스튜디오는 음성 기술이 필요한 기업뿐 아니라 콘텐츠를 제작하는 미디어 및 엔터테인먼트 분야에서도 널리 활용될 수 있다는 것이 회사 측의 설명이다.

보이스 스튜디오는 1만시간 분량 데이터를 학습한 기본 모델을 탑재, 음성 인식률을 약 96%까지 높였다.

또 평균 1초 이내에 음성인식 결과를 출력하는 ‘종단형 음성인식 기술’을 적용, 모든 데이터 입력이 끝날 때까지 기다려야 했던 기존과 달리 실시간 음성인식 시스템의 구축이 가능하게 됐다.

솔트룩스는 해당 기술을 통해 국회에 세계 최초의 ‘AI 음성인식 생중계 자막 시스템’을 구현, 디지털 플랫폼 정부의 초석을 쌓기도 했다.

음성합성 속도도 대폭 향상됐다. 새로운 음성 합성 엔진을 적용하고 전이 학습 기반 기술을 도입, 12시간 분량 음성 데이터를 학습하는 데 걸리는 시간을 일주일에서 3일로 단축했으며 30분 분량의 적은 데이터로도 새로운 목소리를 만들어낼 수 있게 됐다.

코딩을 잘 모르는 사람도 음성 모델 생성-학습-배포-모니터링 기능들을 쉽게 사용할 수 있도록 제작된 ‘원클릭 관리 도구’도 보이스 스튜디오의 핵심 중 하나다.

이외에도 ▲i-Vector 기반 화자 분리 엔진 ▲비 한글 표기에 대한 발음 생성 기능 등을 탑재, 음성인식 및 합성 기술을 활용하고자 하는 이들에게 인기를 얻을 것으로 예상된다.

솔트룩스 관계자는 “내년에는 클라우드 기반 서비스를 통해 B2C 대상으로도 고객층을 확대해 나갈 예정”이라며 “누구나 AI 서비스를 만들고 배포할 수 있는 스튜디오 제품을 지속해서 선보여 AI의 대중화에 기여하겠다”고 말했다.

/박진영 기자(sunlight@inews24.com)

▶네이버 채널에서 '아이뉴스24'를 구독해주세요.

▶재밌는 아이뉴스TV 영상보기▶아이뉴스24 바로가기

[ⓒ 아이뉴스24 무단전재 및 재배포 금지]

Copyright © 아이뉴스24. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?