전자통신연, 24개 주요 언어 이해 음성인식 기술 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식한 뒤 문자로 변환할 수 있는 '대화형 인공지능' 기술을 개발했다고 3일 밝혔다.
김상훈 책임연구원은 "국내 기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다"며 "이번 연구성과를 기반으로 24개 언어로 음성인식 서비스를 확대해 중소·벤처기업, 학교, 개인 개발자 등 다양한 사용자들에게 다국어 음성인식 관련 사업 기회를 제공할 예정"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(대전=연합뉴스) 김준호 기자 = 한국전자통신연구원(ETRI)은 세계 주요 24개 언어를 음성으로 인식한 뒤 문자로 변환할 수 있는 '대화형 인공지능' 기술을 개발했다고 3일 밝혔다.
음성인식 기술을 개발하려면 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않은데 연구진은 자기 지도학습, 대용량 다국어 사전 학습 모델, 음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 어려움을 해결했다.
또 느린 응답속도 문제는 스트리밍 추론 기술을 개발해 실시간 처리가 가능하도록 개선했다.
ETRI는 2020년 음성인식 기술을 개발한 후 국내외 30여 기업에 기술 이전했다.
기업들은 회의록 작성, 자막 통역, 키오스크, 의료·교육, 인공지능(AI) 컨택센터 등 다양한 AI 서비스에 기술을 활용 중이다.
올해 안으로 지원 언어를 30여개로 확대할 예정인 연구진은 국내외 전시 참여, 기업체 설명회 등을 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 추진할 방침이다.
연구진은 '2018 평창 동계 올림픽' 공식 자동 통역 서비스에 핵심 기술을 제공한 바 있다.
김상훈 책임연구원은 "국내 기술로 글로벌 선도업체와 대등한 수준의 음성인식 기술을 개발했다"며 "이번 연구성과를 기반으로 24개 언어로 음성인식 서비스를 확대해 중소·벤처기업, 학교, 개인 개발자 등 다양한 사용자들에게 다국어 음성인식 관련 사업 기회를 제공할 예정"이라고 말했다.
kjunho@yna.co.kr
▶제보는 카톡 okjebo
Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지
- '머스크가 반한' 사격 김예지, 테슬라 앰배서더 선정…국내 최초(종합) | 연합뉴스
- 경찰서 유치장서 40대 피의자 식사용 플라스틱 젓가락 삼켜 | 연합뉴스
- 은평구서 30대 아들이 70대 아버지 살해…긴급체포 | 연합뉴스
- 김남국, 文 전 대통령에 "신선놀음 그만하고 촛불 들어야" | 연합뉴스
- 9살·10살 자녀 둔 30대 엄마 뇌사 장기기증으로 6명 살려 | 연합뉴스
- 北 억류된 선교사 아들 "결혼식에 아버지 오셨으면" | 연합뉴스
- 트럼프 "여성이 좋아하든 싫어하든 보호"…해리스 "여성 모욕"(종합) | 연합뉴스
- '간첩 혐의' 中교민 깜깜이 수감 왜?…수사기관에 유리한 현지법 | 연합뉴스
- '이강인에 인종차별 발언' PSG 팬, 서포터스 그룹서 영구 제명 | 연합뉴스
- '이선균 협박' 유흥업소 여실장, 3차례 마약 투약 징역 1년 | 연합뉴스