KT 'AI 원팀' 10개월만에 첫 성과.. 딥러닝 음성합성 등 4가지 기술 개발

이승주 기자 2021. 1. 7. 14:40
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

KT와 현대중공업그룹, LG전자, LG유플러스, 동원그룹, 한국과학기술원(KAIST),한양대, 한국전자통신연구원(ETRI) 등이 참여해 출범한 '인공지능(AI) 원팀'이 연구 10개월여 만에 4종의 AI 기술을 개발하는데 성공했다.

AI 원팀은 AI 기술 및 솔루션을 즉시 산업 현장에 적용해, 데이터활용→AI 기술개발→상용화→산업문제 해결로 이어지는 신속한 선순환 구조를 창출한다는 계획이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

산업 현장에 즉시 적용 방침

KT와 현대중공업그룹, LG전자, LG유플러스, 동원그룹, 한국과학기술원(KAIST),한양대, 한국전자통신연구원(ETRI) 등이 참여해 출범한 ‘인공지능(AI) 원팀’이 연구 10개월여 만에 4종의 AI 기술을 개발하는데 성공했다. AI 원팀은 AI 기술 및 솔루션을 즉시 산업 현장에 적용해, 데이터활용→AI 기술개발→상용화→산업문제 해결로 이어지는 신속한 선순환 구조를 창출한다는 계획이다.

KT는 AI 원팀 공동 연구·개발(R&D)의 첫 성과로 4종의 AI 기술 개발에 성공했다고 7일 밝혔다. 4개 기술은 △딥러닝 음성합성(P-TTS) △E2E(End to End) 음성인식 △무빙 픽처(Moving Picture) △AI 기반 로봇 고장 진단 기술이다. 이 중 3개는 KT 사업의 핵심 기술로 활용하고, 1개는 현대중공업그룹의 산업 현장에 적용할 예정이다.

딥러닝 음성합성 기술은 기존 기술 대비 비용은 4분의 1 수준으로 줄이고, 속도는 10배 가량 높인 점이 특징이다. 순서대로 음성을 만드는 방식에서 동시에 음성을 만들어내는 방식으로 구조를 바꿔 획기적인 속도 향상이 가능하도록 했다. E2E 음성인식 기술은 인식 정확도를 크게 높일 수 있고, 적은 양의 학습 데이터로 도메인 확장이 가능해 활용성이 크다. 사양 증강, 데이터 증강 등 최신 학습기술을 적용해 기존 하이브리드 방식에 비해 단어 오류율(WER)을 7% 이상 높였다.

무빙 픽처 솔루션은 이미지를 영상으로 바꾸는 AI 기술로, 이미지에 모션 효과를 적용해 영상으로 변환한다. 영상 분할·객체 검출·모션 추정·초해상도 이미지 복원과 같은 최신 AI 기술이 적용됐다. AI 기반 로봇 고장 진단 기술은 진동 신호에 음성처리 기술과 딥러닝 기술을 적용해 핵심 구동부품인 감속기의 이상을 탐지하는 등 AI가 산업용 로봇의 고장을 진단할 수 있는 기술이다.

이승주 기자 sj@munhwa.com

[ 문화닷컴 | 네이버 뉴스 채널 구독 | 모바일 웹 | 슬기로운 문화생활]

[Copyrightⓒmunhwa.com '대한민국 오후를 여는 유일석간 문화일보' 무단 전재 및 재배포 금지(구독신청:02)3701-5555 / 모바일 웹:m.munhwa.com)]

Copyright © 문화일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?