ETRI, 24개 언어 이해하는 음성인식 기술 개발

정인선 기자 2022. 11. 3. 19:24
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 인식할 수 있는 '대화형 인공지능(AI)' 기술을 개발했다고 3일 밝혔다.

그동안 음성인식 기술을 개발하려면 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않다는 문제점이 지적돼 왔다.

ETRI는 이번에 개발한 기술이 구글(Google) 등 글로벌 업체와 수준이 대등하다고 설명했다.

앞서 ETRI는 2020년 음성인식 기술을 개발한 후 현재까지 국내외 30여 기업에 기술 이전을 완료했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

"국내 최다언어 최고성능 자랑"…연내 30개어 확보 목표
24개 음성인식 기술을 이용해 영어를 실시간 통역하는 모습. 사진=ETRI 제공


한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 인식할 수 있는 '대화형 인공지능(AI)' 기술을 개발했다고 3일 밝혔다.

그동안 음성인식 기술을 개발하려면 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않다는 문제점이 지적돼 왔다.

연구진이 이번에 개발한 기술은 자기 지도학습, 대용량 다국어 사전 학습 모델, 음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 기존의 어려움을 해결했다. 느린 응답속도 문제는 스트리밍 추론 기술을 통해 실시간 처리가 가능하도록 개선했다고 연구팀은 전했다.

ETRI는 이번에 개발한 기술이 구글(Google) 등 글로벌 업체와 수준이 대등하다고 설명했다.

앞서 ETRI는 2020년 음성인식 기술을 개발한 후 현재까지 국내외 30여 기업에 기술 이전을 완료했다. 연구진은 올해 안으로 지원 언어를 30여개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.

김상훈 책임연구원은 "이 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다"고 말했다.

Copyright © 대전일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?