고문헌 번역 '속도'…한문 문장 자동 분절 프로그램 개발

김진호 기자 2023. 12. 21. 09:18
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국국학진흥원은 전통 기록유산 속 한문 문장을 자동으로 분절해주는 '고문헌 한문 자동 문장 분절' 프로그램을 개발했다고 21일 밝혔다.

한국국학진흥원은 소장 자료를 기반으로 원문자료 자동 인식부터 문장 분절, 한글 번역까지 일련의 과정을 인공지능을 통해 자동화시킬 계획이다.

이번에 공개한 '고문헌 자동 문장 분절 프로그램'은 한문 번역 과정의 정확도 제고를 위해 필수적인 것으로, 이후 자동번역 시스템 구현에 기초 자료로 활용될 예정이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국국학진흥원, 고문헌 자동 문장 분절 웹서비스
'고문헌 한문 자동 문장 분절' 화면 (사진=한국국학진흥원 제공) *재판매 및 DB 금지

[안동=뉴시스] 김진호 기자 = 한국국학진흥원은 전통 기록유산 속 한문 문장을 자동으로 분절해주는 '고문헌 한문 자동 문장 분절' 프로그램을 개발했다고 21일 밝혔다.

한국국학진흥원에 따르면 지난해부터 국학자료를 대상으로 한 AI(인공지능) 기반 자동번역 프로그램 개발에 착수했다.

그 결과 고문헌 문자인식(OCR) 프로그램에 이어 자동으로 문장을 분절해주는 프로그램 개발에 성공했다.

이번 인공지능 기반 고문헌 자동 문장 분절 프로그램의 정확도는 약 90% 이상이다.

전통 기록유산은 대부분 한문으로 기술돼 일반인 접근이 어려운 실정이다.

따라서 현재 활용을 위해서는 디지털 텍스트화와 한글 번역이 필수적이다.

한국국학진흥원은 소장 자료를 기반으로 원문자료 자동 인식부터 문장 분절, 한글 번역까지 일련의 과정을 인공지능을 통해 자동화시킬 계획이다.

이번에 공개한 '고문헌 자동 문장 분절 프로그램'은 한문 번역 과정의 정확도 제고를 위해 필수적인 것으로, 이후 자동번역 시스템 구현에 기초 자료로 활용될 예정이다.

한국국학진흥원 관계자는 "지금과 같은 아날로그식 방법을 유지할 경우 전통 기록유산 디지털화 및 번역에는 300년 이상의 오랜 기간이 소요된다"며 "하지만 인공지능 기술을 활용한 문자인식, 문장 분절을 활용하면 관련 인력 대비 30배 이상 빠른 속도로 디지털화 작업이 가능하다"고 말했다.

☞공감언론 뉴시스 kjh9326@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?