한문 고문서 번역도 AI로 ‘척척’
[KBS 대전] [앵커]
인공지능이 어려운 한자로 적힌 고문서를 번역하는 시대가 왔습니다.
국내 연구진이 AI를 기반으로 고문서를 번역하는 플랫폼을 만들었는데 일반인도 옛 문헌을 쉽게 만날 수 있을 것으로 기대됩니다.
박해평 기자입니다.
[리포트]
전자통신연구원이 개발한 AI 고서 번역 플랫폼입니다.
조선 시대 지리서 '동국여지승람'의 일부분을 클릭하자, 해당 부분이 한글로 번역됩니다.
그동안 한문 고서를 번역하기 위해서는 고서 원문을 하나하나 스캔을 떠 글자로 옮기고 입력한 뒤 한글로 변경하는 과정을 거쳐 번역서를 만들었습니다.
이번에 개발된 번역 플랫폼은 스스로 다양한 서체의 한자와 문장 해석을 공부해, 현재 92%의 인식 정확도와 85점의 번역 정확도를 갖게 됐습니다.
[민기현/한국전자통신연구원 선임연구원 : "천만 개의 한자를 가지고 인식기술을 개발했습니다. 145만 개의 다양한 문장을 가지고 번역기술을 개발했습니다."]
또, 번역 과정을 기록하고 한자를 검수하는 기능도 갖춰 여러 명의 번역가가 공동으로 번역 작업도 할 수 있게 했습니다.
아직 한시나 편지 등에 쓰이는 시적, 정서적 표현까지는 AI가 반영하지 못하고 있지만, 데이터가 축적되면 곧 해결될 것으로 예상됩니다.
[권경열/한국고전번역원 책임연구원 : "(교육된 문장이) 750만 개를 넘어서야 그런대로 품질을 정확히 담보할 수 있지 않을까 생각하고 있고요. 앞으로 저희들이 많은 코퍼스(말뭉치)를 구축을 해서..."]
연구원은 번역을 마친 고서 십여 권의 내용을 담은 키오스크를 전국 11개 도서관 등에 설치한 가운데, 촬영으로 해석이 가능한 어플리케이션 등을 개발하고 있습니다.
KBS 뉴스 박해평입니다.
촬영기자:강수헌
박해평 기자 (pacific@kbs.co.kr)
Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지
- 이재명 체포동의안 가결…2표가 갈랐다
- “18장 분량”…한동훈이 준비한 이재명 ‘체포 요청서’ 내용은?
- 한덕수 해임건의안·안동완 검사 탄핵소추안 가결…헌정 사상 처음
- 초유의 감사위원 수사 요청…감사원은 ‘내전 상태’
- “알라딘 전자책 100만 권 유포할거야”…잡고 보니 10대 해킹범
- [단독] 유아인 지인, ‘해외 도피’ 직전 자금 지원받아…당일 바로 출국
- ‘여성 비하 논란’ 위키트리 기사 쓴 ‘김행 기자’ 정체는?
- ‘북러’에서 ‘러북’, ‘위원장’에서 ‘독재자’…호칭에 담긴 의미는?
- 주일 대사관엔 없었던 ‘대일 항의 논평’…독도·야스쿠니 항의는 국내용?
- “러 흑해함대 사령부 타격”…크림반도 곳곳 포화