말귀 어두운 '사오정' AI 스피커..이 센서 하나로 해결

문희철 2021. 2. 15. 16:29
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KAIST 연구팀, AI 음성인식 센서 개발
스마트폰·AI스피커의 음성 식별도 개선
"조만간 상용화 가능. 파트너 물색 중"
KT가 개발한 음성인식(AI) 스피커. 지난해 등장한 이 AI 스피커는 음성명령을 활용해서 침대·커튼 등의 동작을 제어할 수 있다. [사진 KT]

사람의 귓속 구조를 본뜬 고품질 음성인식 센서가 개발됐다. 스마트폰이나 인공지능(AI) 스피커에 탑재해 조만간 상용화할 수 있는 기술이다.

한국과학기술원(KAIST)은 음성인식 오류를 최대 95% 개선한 세계 최초의 ‘공진형 유연 압전 음성 센서’를 개발했다고 15일 밝혔다. 공진형 유연 압전 음성 센서는 특정 주파수 영역에서 센서가 큰 진폭으로 진동하는 현상(공진)과 압력을 가하면 전기적 신호가 자발적으로 생성되는 현상(압전)을 응용한 센서다.

스마트폰과 인공지능 스피커에 실제로 탑재한 KAIST 연구진의 유연 압전 음성 센서. [사진 KAIST]

지금까지 AI 스피커는 음성인식 오류를 주로 소프트웨어 기술로 해결하려고 시도했다. 이에 비해 이건재·왕희승 KAIST 신소재공학과 연구진은 물리적으로 음성을 인식하는 센서 자체를 새롭게 개발했다. 귀가 어두운 사람이 보청기를 끼면 더 잘 들리는 것과 같은 개념이다.

사람의 귀는 달팽이관에 있는 사다리꼴 기저막이 가청 주파수 대역에서 공진 현상을 유발해 소리를 증폭한다. 길이가 불과 30㎜인 기저막은 마이크로미터(μm) 구조 덕분에 공진 현상을 유발할 수 있다. 연구진은 이런 귓속 기저막 구조를 본따 매우 얇고 유연한 센서를 제작했다. 이건재 교수는 “인간의 귀 구조를 모사해 공진형 음성 센서를 제작한 건 사상 최초”라고 설명했다.

이렇게 제작한 센서는 상대적으로 음성을 정확히 식별했다는 것이 연구진의 설명이다. 음성을 식별하는 정확도는 높았고, 상황에 따라 음성을 잘못 인식하는 확률은 60~95% 줄었다. 이 교수는 “음성명령을 각각 50회씩 테스트한 결과, 시판 중인 AI 스피커나 아이폰·갤럭시 등 스마트폰이 음성명령을 평균 10번 잘못 인식할 때, 연구진의 센서를 사용한 제품은 음성명령을 1~4번 정도만 잘못 인식했다”고 소개했다.

연구진은 이렇게 개발한 센서를 스마트폰과 AI 스피커에 탑재해 제품화하는 데도 성공했다. 연구진이 창업한 기업(프로닉스)은 미국 실리콘밸리의 정보기술(IT) 기업과 협업해 제품화를 추진하고 있다.

이 교수는 “이번에 제품화한 음성 센서는 미래 AI 기술을 구동하는 핵심 센서로, 조만간 실생활에 적용한 제품을 볼 수 있을 것”이라며 “국내 기업에도 관심은 있지만 AI·사물인터넷(IoT) 분야에서 세계를 리드하는 해외 기업을 파트너로 물색하는 단계”라고 했다.

한국연구재단의 지원을 받아 수행한 이번 연구는 국제학술지
「사이언스 어드밴스드」

12일자에 실렸다.

문희철 기자 reporter@joongang.co.kr

Copyright © 중앙일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?