[안동]"기록유산, AI와 만나다" 한자 인식 서비스 '첫선'

김서현 2022. 12. 26. 21:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

 ◀앵커▶한국국학진흥원이 한문으로 쓰여져서 읽기 어려웠던 우리 기록유산을, 휴대폰으로 쉽게 번역할 수 있는 기술을 개발하고 있습니다.

이 기술이 상용화되면, 국내 국학자료의 디지털화 작업 속도를 훨씬 더 높일 수 있을 걸로 기대됩니다.

현재 디지털화 속도로는 국내 국학 자료를 모두 이미지 디지털화하는 데 20년, 문자는 380년 넘게 걸리는데, 이 프로그램이 상용화되면 지금보다 작업 속도를 30배는 더 앞당길 수 있을 걸로 예상됩니다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

 ◀앵커▶
한국국학진흥원이 한문으로 쓰여져서 읽기 어려웠던 우리 기록유산을, 휴대폰으로 쉽게 번역할 수 있는 기술을 개발하고 있습니다.

이 기술이 상용화되면, 국내 국학자료의 디지털화 작업 속도를 훨씬 더 높일 수 있을 걸로 기대됩니다.

김서현 기자가 취재했습니다.

◀기자▶
1616년 음력 8월 15일. 

"가동에서 합제를 지냈는데, 영해의 외조부모도 함께 제사를 지냈다"

조선 중기 학자 김택룡의 '조성당일기', 추석 명절, 친가와 외가 구분 없이 함께 제사를 지냈던 양반의 유연한 태도를 확인할 수 있는 기록입니다.

이렇게 선조들의 옛 자취가 뚜렷한 일기와 유교책판 등 방대한 양의 국학 자료가 국내에 현존하고 있지만, 그중 이미지로 디지털화된 자료는 아직 절반이 채 안 되고, 문자로 디지털화된 건 5%에도 못 미치는 걸로 추정됩니다.

국학 자료 디지털화가 여전히 사람 손으로 복사해서 컴퓨터로 옮기는 방식으로 진행되고 있어, 막대한 예산과 인력이 들기 때문입니다.

그런데 한국국학진흥원이 인공지능 기술로 디지털화와 번역 작업 시간을 획기적으로 단축하는 프로그램을 자체 개발 중인데, 그 첫 결과물이 공개됐습니다.

'고도서 한자 인식 프로그램' 누리집 서비스로 한문으로 된 고문서 사진이나 이미지를 이 누리집에 등록하면, 자동으로 한자를 인식해 텍스트로 바꿔줍니다.

인식한 한자가 들어간 또 다른 고문서 자료도 연동해서 찾아볼 수 있습니다.

◀박나연 한국국학진흥원 전임연구원▶
"집 안에 있는 일기류라든지 편지류, 집 안에 있는 문서들도 휴대폰으로 촬영해서 손쉽게 이미지, 텍스트화된 결과를 얻을 수 있습니다."

현판과 고문서에 적힌 한문도, 휴대전화로 찍어서 프로그램에 등록할 수 있습니다.

검은 배경에 흰색으로 쓰인 해서체는 인식 정확도가 90%가 넘습니다.

"이렇게 문화재 현장에서 발견한 한문도 인식 프로그램을 통해 휴대폰으로 쉽게 검색할 수 있습니다."

한국국학진흥원은 필기체의 일종인 행서와 초서체까지 인식할 뿐만 아니라 장기적으로는 자동 한문 번역 프로그램 개발까지 추진하고 있습니다.

현재 디지털화 속도로는 국내 국학 자료를 모두 이미지 디지털화하는 데 20년, 문자는 380년 넘게 걸리는데, 이 프로그램이 상용화되면 지금보다 작업 속도를 30배는 더 앞당길 수 있을 걸로 예상됩니다.

◀배성길 한국국학진흥원 부원장▶
"한국국학진흥원이 전국에서 가장 많은 60만 점이라는 국학 자료를 갖고 있는데, 이 사업이 완성도가 더 높아지면 일반인도 (국학자료에) 쉽게 접근할 수 있어서···"

첨단기술과 만난 우리 기록유산, 기록 보전뿐만 아니라 콘텐츠 개발 등 유산의 가치를 재발견하는 계기가 될 걸로 기대를 모으고 있습니다.

MBC 뉴스 김서현입니다. (영상취재 최재훈, CG 황현지)

Copyright © 대구MBC. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?