정확도 90% 이상… 고문헌 한문 자동 분절 프로그램 개발

배소영 2023. 12. 21. 10:11
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국내 국학 연구진이 '고문헌 한문 자동 문장 분절 프로그램'을 개발했다.

한국국학진흥원이 지난해부터 국학자료 AI(인공지능) 기반 자동번역 프로그램 개발 사업에 매진한 결과다.

한국국학진흥원은 소장 자료 번역에 자동 문장 분절 프로그램을 이용한다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국국학진흥원 기술 개발 연구 성과
인력 대비 30배 이상 빠른 속도
테스트 거친 후 프로그램 제공

국내 국학 연구진이 ‘고문헌 한문 자동 문장 분절 프로그램’을 개발했다. 한국국학진흥원이 지난해부터 국학자료 AI(인공지능) 기반 자동번역 프로그램 개발 사업에 매진한 결과다.

22일 한국국학진흥원에 따르면 전통 기록유산은 대부분 한문으로 기술돼 일반인은 접근하기 어렵다. 지금과 같은 아날로그 번역 방법을 유지하면 전통 기록유산의 디지털화와 번역에는 300년 이상 소요된다.
고문헌 한문 자동 문장 분절 결과. 한국국학진흥원 제공
하지만 인공지능 기술을 활용하면 인력 대비 30배 이상의 빠른 속도로 디지털화 작업이 가능하다. 따라서 디지털 텍스트화와 한글 번역이 필수적인 상황이다.

한국국학진흥원은 소장 자료 번역에 자동 문장 분절 프로그램을 이용한다. 원문 자료의 자동 인식부터 문장 분절, 한글 번역까지 일련의 과정을 인공지능을 통해 자동화한다. 자동 문장 분절 프로그램의 정확도는 90% 이상이다.

한국국학진흥원 관계자는 “이달까지 연구원을 대상으로 테스트를 마친 후 일반인에게 자동 문장 분절 프로그램을 공개한다”면서 “고문헌 문자인식(OCR)을 활용한 고도서 한자 인식과 이미지 검색 서비스도 지원하고 있다”고 말했다.

안동=배소영 기자 soso@segye.com

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?