“영어·중국어·일어, 힘들게 배울 필요 있나?” 24개 언어 실시간 통역, 한국 기술로 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한국어와 영어, 중국어, 일본어뿐만 아니라 독일어, 프랑스어, 스페인어, 러시아어 등 세계 주요 24개 언어를 인식해 실시간 통역할 수 있는 음성인식 기술이 개발됐다.
ETRI가 개발한 음성인식 기술의 성능은 구글 등 글로벌 업체와 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
- 30개어 연내 확보, 희소언어 확장 걸림돌 해결할 것
[헤럴드경제=구본혁 기자] 한국어와 영어, 중국어, 일본어뿐만 아니라 독일어, 프랑스어, 스페인어, 러시아어 등 세계 주요 24개 언어를 인식해 실시간 통역할 수 있는 음성인식 기술이 개발됐다.
한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식, 문자로 변환할 수 있는 ‘대화형 인공지능(Conversational AI) 기술’을 개발했다고 3일 밝혔다.
ETRI가 개발한 음성인식 기술의 성능은 구글 등 글로벌 업체와 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다.
기존 음성인식 기술을 개발하기 위해서는 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다.
연구진은 ▷자기 지도학습 의사 레이블 적용 ▷대용량 다국어 사전 학습 모델 ▷음성 데이터의 오디오 데이터 생성 증강 기술 등을 통해 언어 확장의 어려움을 해결했다.
또한 느린 응답속도의 문제는 스트리밍 추론 기술을 개발, 실시간 처리가 가능하도록 개선했다. 의료와 법률, 과학기술 등 특정한 도메인에 대한 음성인식 특화가 쉽도록 하이브리드 종단형 인식 기술도 개발해 적용했다.
ETRI는 지난 2020년 종단형 음성인식 기술을 개발한 후, 30여 개의 국내·외 기업에 음성인식 기술을 이전했다. 이를 통해 기업들은 ▷회의록 작성 ▷자막 통역 ▷키오스크 ▷의료·교육 ▷AI 컨택센터 등 다양한 AI 서비스에 ETRI의 음성인식 기술을 활용 중이다.
연구진은 이번 다국어 확대와 응답 속도 지연 해결 등 신기술 적용을 통해 음성인식 기술 활용 범위를 확대, 사업화를 추진할 예정이라고 밝혔다.
특히 연말까지 지원 언어를 30여 개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.
김상훈 ETRI 복합지능연구실 박사는 “국내기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다는 데 의의가 있다”며 “이 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술자주권을 확보하는 데 큰 도움이 되길 바란다”고 말했다.
nbgkoo@heraldcorp.com
Copyright © 헤럴드경제. 무단전재 및 재배포 금지.
- 이지한母 “내 보물인데…경찰이 신고 무시했다” 신발 안고 오열
- “마스크에서 나던 냄새, 유해물질 이었다”...통풍 후 착용해야
- "운구비 없어 고국 못가"...이영애, 숨진 러시아인 "돕고 싶다"
- 사람 구하는데 "그만 올려" 소리치던 남성...직전까지 구조 돕던 사람
- ‘미인대회서 비밀연애’ 두 미녀, 진짜 부부됐다 “행복해요”
- "경사로에 마네킹 세워보니"...이태원 참사 현장 재현한 日 방송
- ‘음주운전’ 김새론, 5개월여째 자숙 중이라는데…깜짝 근황
- 이태원 간 유명인이 유아인? “사실무근…해외 체류 중” 루머 반박
- 김C “사고 났는데 경찰들 걸어서 출동”…이태원 참사 목격담
- 고개 숙인 이상민 "유가족과 국민 마음 살피지 못해…심심한 사과"