타임소프트, 2차 AI 음성 학습데이터 구축사업 수주

남혁우 기자 2022. 10. 11. 17:44
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

타임소프트(대표 김철희)는 '2022년 인공지능 학습용 데이터 구축사업 2차' 음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터 주관기관으로 선정됐다고 밝혔다.

과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 본 사업 과제는 인공지능에 활용할 수 있는 텍스트를 음성으로 변환하는 기술(TTS)에 적용할 데이터셋을 구축하는 과제다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(지디넷코리아=남혁우 기자)타임소프트(대표 김철희)는 ‘2022년 인공지능 학습용 데이터 구축사업 2차’ 음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터 주관기관으로 선정됐다고 밝혔다.

과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 본 사업 과제는 인공지능에 활용할 수 있는 텍스트를 음성으로 변환하는 기술(TTS)에 적용할 데이터셋을 구축하는 과제다. 아나운서 50여명 이상 참여해 뉴스 대본 4천 건을 1천 시간의 음성데이터로 전환하는 작업이다.

정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT과학 등 여러가지 뉴스 분야의 대본을 통하여 전, 현 직 아나운서의 음성을 통해 품질 높은 학습데이터를 구축한다.

타임소프트

본 과제를 통해 뉴스 대본 텍스트를 아나운서 목소리로 뉴스 방송, 기계 독해 연구, 비정형 데이터 질의-응답, 대화형 시스템 등의 실생활에 적용 활용할 수 있다. AI 스피커, 뉴스기사를 읽어주는 AI챗봇, 비서 서비스 등 여러 분야에 활용 가능하다.

본 사업은 타임소프트가 주관기관으로 하며, 케이엘큐브와 코난테크놀로지, 에이스솔루션등 음성데이터 구축 전문 기업으로 컨소시엄이 구성되었다. 또한 봄온 아카데미, 스포티비 아카데미가 본 사업에서 구축된 학습 모델을 활용할 수요기관으로 참여했다.

음성 데이터 구축 부문 뉴스 대본 및 앵커 음성데이터의 학습데이터가 구축되는 내년 상반기에 AI허브에 공개될 예정이다.

타임소프트는 한국지능정보사회진흥원(NIA)에서 추진한 2020년 한국인 대화 음성, 2020년 한국어 방안(강원도), ‘21년 복지분야 콜센터상담 등 음성데이터 인식(STT) 분야에 인공지능 학습데이터 구축사업도 진행했다.

남혁우 기자(firstblood@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?