AI로 한자 자동 변환…국학자료 프로그램 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 기술을 활용해 국학자료를 디지털 텍스트로 자동 변환하는 프로그램이 보급된다.
이번에 공개한 프로그램은 국학자료 속 한자를 디지털 텍스트로 변환하는 기술이다.
정종섭 한국국학진흥원장은 "인공지능을 활용해 국학자료를 자동 번역하는 사업은 일반인들이 국학자료를 쉽고 가깝게 접할 수 있는 중요한 작업"이라며 "나아가 우리의 전통 기록유산과 첨단기술을 접목한 새로운 일자리 창출뿐만 아니라 기록유산에 담긴 소중한 가치를 발굴하는 데 기여할 것"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
인공지능(AI) 기술을 활용해 국학자료를 디지털 텍스트로 자동 변환하는 프로그램이 보급된다. 한국국학진흥원이 문자인식(OCR) 프로그램을 개발한 결과다. 이 프로그램을 활용하면 국학자료의 디지털화 속도를 30배 이상 앞당길 수 있다.
그동안 국학자료의 디지털화 번역 작업은 20년 전 수준에 머물러 왔다. 촬영과 스캐닝을 거쳐 텍스트 입력, 전문 번역을 해야 한다. 현재 국학자료의 이미지 디지털화는 50% 미만, 텍스트 디지털화는 5%가량이다. 전문 연구기관에 따르면 지금과 같은 방식을 유지하면 국학자료에 대한 이미지 디지털화 완료에는 20년 이상, 텍스트 디지털화 완료에는 380년 이상이 걸린다.
하지만 인공지능 기술을 활용한 문자인식 프로그램을 활용하면 인력 대비 30배 이상 빠른 속도로 디지털화 작업이 가능하다. 이번에 공개한 프로그램은 국학자료 속 한자를 디지털 텍스트로 변환하는 기술이다. 한문 인식률의 정확성은 90% 이상이다.
한국국학진흥원은 국내에서 가장 많은 60만 점의 국학자료를 소장하고 있다. 향후 지속적인 인공지능 데이터 자동화를 통해 한자의 해서체뿐만 아니라 초서체에 대한 인식률도 높여 나간다는 계획을 세웠다.
정종섭 한국국학진흥원장은 “인공지능을 활용해 국학자료를 자동 번역하는 사업은 일반인들이 국학자료를 쉽고 가깝게 접할 수 있는 중요한 작업”이라며 “나아가 우리의 전통 기록유산과 첨단기술을 접목한 새로운 일자리 창출뿐만 아니라 기록유산에 담긴 소중한 가치를 발굴하는 데 기여할 것”이라고 말했다.
안동=배소영 기자 soso@segye.com
Copyright © 세계일보. 무단전재 및 재배포 금지.
- '3개월 시한부' 암투병 고백한 오은영의 대장암...원인과 예방법은? [건강+]
- “내 성별은 이제 여자” 女 탈의실도 맘대로 이용… 괜찮을까 [어떻게 생각하십니까]
- 속도위반 1만9651번+신호위반 1236번… ‘과태료 전국 1위’는 얼마 낼까 [수민이가 궁금해요]
- '발열·오한·근육통' 감기 아니었네… 일주일만에 459명 당한 '이 병' 확산
- “그만하십시오, 딸과 3살 차이밖에 안납니다”…공군서 또 성폭력 의혹
- “효림아, 집 줄테니까 힘들면 이혼해”…김수미 며느리 사랑 ‘먹먹’
- ‘女스태프 성폭행’ 강지환, 항소심 판결 뒤집혔다…“前소속사에 35억 지급하라”
- 사랑 나눈 후 바로 이불 빨래…여친 결벽증 때문에 고민이라는 남성의 사연
- "오피스 남편이 어때서"…男동료와 술·영화 즐긴 아내 '당당'
- 예비신랑과 성관계 2번 만에 성병 감염…“지금도 손이 떨려”