“한 달 작업 하루 만에”…한자 띄어쓰기 AI 개발

김지홍 2023. 12. 28. 08:53
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[KBS 대구] [앵커]

옛 문헌의 한문을 자동으로 띄어쓰기해주는 프로그램이 국내에서 처음으로 개발됐습니다.

한자 기초 번역부터, 디지털로 만들기까지 걸리던 시간이 크게 줄 것으로 기대됩니다.

김지홍 기자가 보도합니다.

[리포트]

옛 문헌을 스캔한 이미지 파일을 컴퓨터 프로그램에 띄웁니다.

전체 한자를 인식해 디지털 텍스트로 옮긴 뒤, 단 2~3초 만에 자동으로 문장 띄어쓰기를 해줍니다.

한국국학진흥원이 국내 최초로 개발한 인공지능 기반의 한문 자동 문장 분절 프로그램입니다.

[정재석/한국국학진흥원 국학기반본부 팀장 : "번역해야 할 (전통기록유산) 자료가 굉장히 많이 남아있습니다. 인공지능을 활용해서 쉽게 사람이 이해하기 쉽게 하도록 이 프로그램을 개발하게 됐습니다."]

한문 번역에 있어 분절은 번역 정확도를 가르는 핵심 과정입니다.

문맥을 파악해 우리말로 바꾸는 기초가 되기 때문입니다.

1억 자가 넘는 분절 문장을 학습한 AI의 작업 정확도는 90% 이상.

사람이 일일이 컴퓨터에 입력하고 검수하면 한 달 걸릴 분량을 단 하루 만에 끝낼 수 있습니다.

획을 흘려 쓴 서체까지는 아직 전부 반영하지 못하지만, 데이터가 축적되면 곧 해결될 것으로 예상됩니다.

[박나연/한국국학진흥원 콘텐츠정보팀 전임연구원 : "내년부터는 저희가 본격적으로 번역 사업을 시작합니다. 그래서 자동번역이 되면 일반인들이 누구나 쉽게 고문서에 대한 정확한 정보를 알 수 있습니다."]

내년에 프로그램이 일반에 공개되면, 집 깊숙이 방치됐던 족보나 고서 같은 옛 글들도 누구나 쉽게 풀이할 수 있게 될 것으로 보입니다.

KBS 뉴스 김지홍입니다.

촬영기자:최동희

김지홍 기자 (kjhong@kbs.co.kr)

Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지

이 기사에 대해 어떻게 생각하시나요?