윤즈정보개발, 인공지능 학습용 데이터 구축사업 완료

전자신문인터넷 서희원 기자 2022. 12. 29. 13:14
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

은 한국지능정보사회진흥원(NIA) 국가 데이터댐 사업의 일환인 인공지능 학습용 데이터 구축사업을 완료했다고 29일 밝혔다.

최근 윤즈정보개발은 한국지능정보사회진흥원(NIA)의 인공지능 학습용 데이터 구축 지원 사업(1차)으로 지정 공모 38개 분야 중 2개 분야 방송콘텐츠 한국어-영어 통·번역 데이터 분야와 한국어-유럽어 통·번역 데이터 분야 참여사업자로 참여했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

윤즈정보개발 기업로고. (주)윤즈정보개발 제공

(주)윤즈정보개발(대표 고윤희)은 한국지능정보사회진흥원(NIA) 국가 데이터댐 사업의 일환인 인공지능 학습용 데이터 구축사업을 완료했다고 29일 밝혔다.

해당 기업은 2009년 설립한 데이터베이스 제작 회사로 정부 주도의 대규모 국가 DB구축 사업인 조선왕조실록 데이터베이스 개발 사업을 비롯해 동양고전정보화사업(전통문화연구회), 고전번역서 DB구축 사업(한국고전번역원), 신문 기사 원문 자료 수집 및 정제 사업(국립국어원) 등을 수행해 왔다. 최근에는 기존 사업 외에도 인공지능(AI) 데이터 구축사업 등 새로운 영역으로 확장하고 있다.

최근 윤즈정보개발은 한국지능정보사회진흥원(NIA)의 인공지능 학습용 데이터 구축 지원 사업(1차)으로 지정 공모 38개 분야 중 2개 분야 방송콘텐츠 한국어-영어 통·번역 데이터 분야와 한국어-유럽어 통·번역 데이터 분야 참여사업자로 참여했다.

이 사업은 방송 콘텐츠 분야의 통·번역 성능 향상을 위해 한국어 방송 콘텐츠의 인공지능 학습용 데이터를 구축하는 프로젝트로 음성 데이터, 번역 말뭉치 데이터를 구축하여 인공지능 학습에 활용할 수 있는 데이터를 구축하는 사업이다.

윤즈정보개발 측에 따르면 해당 사업에서 국내 방송 프로그램을 대상으로 하여 600시간의 전사 데이터를 구축하였고 음성 데이터 번역 약 623시간 분의 번역 문장을 생성하였으며 번역된 데이터를 원어민 발화 120시간을 완료하였다.

또한 문장 데이터 번역 총 약 54만 문장 번역을 데이터를 구축하여 번역 사업 기관으로서의 입지를 확고히 하였으며 해당 데이터와 인공지능 모델도 한국지능정보사회진흥원의 AI허브에 2023년 상반기 중 공개될 예정이라고 설명했다.

윤즈정보개발은 정보통신산업진흥원(NIPA)의 AI바우처 지원 사업에 수요기관으로 참여하여 공급기관인 ㈜에버트란과 함께 ‘AUTOML 번역 모델 기반 MTPE 고전 원문 번역 플랫폼 도입 및 구축’ 과제를 수행하기도 했다. 해당 과제는 인공지능 증분 학습(AUTOML)을 이용해 고전 원문 전문을 기계 번역하는 모델을 생성하고 평가, 관리하는 것을 통해 최종적으로는 AUTOML 기계 번역 모델 기반의 MTPE 전문가 번역 플랫폼을 구축하는 것을 목표로 하는 프로젝트다.

고윤희 윤즈정보개발 대표는 "그동안 윤즈는 한국학 자료를 빅데이터 시대에 맞는 서비스로 구현해 데이터베이스의 활용과 고부가가치 창출 연구에 매진해왔다"며 "윤즈의 탄탄한 기술과 노하우, 그리고 그동안 쌓아온 전문 자료들을 바탕으로 앞으로는 AI 솔루션 사업에 주력할 계획"이라고 말했다.

전자신문인터넷 서희원 기자 (shw@etnews.com)

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?