'24개 언어 음성인식 AI' 30개 기업에 기술이전

김만기 2022. 11. 3. 10:10
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국전자통신연구원(ETRI)이 개발한 '대화형 인공지능(AI) 기술'은 현재 30여개 국내·외 기업에 기술이전됐다.

이 기술은 세계 주요 24개 언어를 인식해 문자로 변환할 수 있어 AI 비서, AI 튜터 등 다양한 AI 서비스 확산에 도움이 되고 있다.

ETRI는 지난 2020년 종단형 음성인식 기술을 개발한 후, 30여개의 국내·외 기업에 음성인식 기술을 이전했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

ETRI, "한국어 음성인식은 구글보다 성능 우위"
회의록 작성, 자막 통역, 키오스크 등으로 활용
한국전자통신연구원(ETRI)이 개발한 '대화형 인공지능(AI) 기술'을 이용해 연구진이 중국어를 실시간 통역하고 있다. ETRI 제공
[파이낸셜뉴스] 한국전자통신연구원(ETRI)이 개발한 '대화형 인공지능(AI) 기술'은 현재 30여개 국내·외 기업에 기술이전됐다. 이 기술은 세계 주요 24개 언어를 인식해 문자로 변환할 수 있어 AI 비서, AI 튜터 등 다양한 AI 서비스 확산에 도움이 되고 있다.

ETRI 측은 3일 "이 음성인식 기술이 구글 등 글로벌 업체와 성능을 비교해도 한국어에서는 우위, 타 언어에서는 대등한 수준"이라고 설명했다.

ETRI는 지난 2020년 종단형 음성인식 기술을 개발한 후, 30여개의 국내·외 기업에 음성인식 기술을 이전했다. 이를 통해 기업들은 △회의록 작성 △자막 통역 △키오스크 △의료·교육 △AI 컨택센터 등 다양한 AI 서비스에 ETRI의 음성인식 기술을 활용 중이다.

연구진은 이번 다국어 확대와 응답 속도 지연 해결 등 신기술 적용을 통해 음성인식 기술 활용 범위를 확대, 사업화를 추진할 예정이라고 밝혔다.

특히, 올해 안으로 지원 언어를 30여개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.

연구진은 "이 기술은 지난 20여년 간 음성인식 기술 개발에 매진해온 결과"라고 설명했다. 연구진은 그동안 2018 평창 동계 올림픽 공식 자동통역 서비스에 핵심 기술을 제공한 바 있다.

현재 ETRI에서는 공공인공지능 오픈 API·DATA 서비스 포털을 통해 11개 언어의 음성인식 서비스를 제공하고 있다. 또한, 이번 연구성과를 기반으로 24개 언어로 음성인식 서비스를 확대해 중소·벤처기업, 학교, 개인 개발자 등 다양한 사용자들에게 다국어 음성인식 관련 사업 기회를 제공할 예정이다.

지난 사업 기간동안 연구진은 국내·외 논문 17편, 특허 43건, 기술이전 20건과 19억원의 기술료 수입을 거뒀다.

한국전자통신연구원(ETRI) 연구진이 24개 음성인식 기술을 이용해 세계 각국 정상의 연설을 실시간으로 자막화 하고 있다. ETRI 제공
기존 음성인식 기술을 개발하기 위해서는 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다. 연구진은 △자기 지도학습 △의사 레이블 △대용량 다국어 사전 학습 모델 △음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 언어 확장의 어려움을 해결했다.

또한, 연구진은 기존에 흔히 활용되던 종단형 음성인식 기술의 단점을 개선해 활용성을 높였다. 느린 응답속도의 문제는 스트리밍 추론 기술을 개발, 실시간 처리가 가능하도록 개선했다. 아울러, 의료와 법률, 과학기술 등 특정한 도메인에 대한 음성인식 특화가 쉽도록 하이브리드 종단형 인식 기술도 개발해 적용했다.

ETRI 복합지능연구실 김상훈 책임연구원은 "국내기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다는 데 의의가 있다"고 말했다. 이어서 "이 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다"고 말했다.
#키오스크 #인공지능 #AI #ETRI #음성인식 #자막통역

Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?