단국대 한문교육연구소, 한자 인식 인공지능 개발…90% 이상 판별
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
단국대 한문교육연구소는 고문헌 속 한자를 90% 이상 인식하는 인공지능을 개발했다고 6일 밝혔다.
단국대 부설 한문교육연구소와 자율형블록체인융합연구소는 고문헌에 표기된 흘림체 글자 등 복잡한 한자에 인공지능 기술을 적용, 한자를 자동으로 분할하고 인식하는 모델을 개발하는데 성공했다.
연구소는 개인 문집류 1259종과 조선왕조실록, 일성록 등에 표기된 1만 593종의 글자를 확인해 3억 80만여자의 한자 이미지를 데이터베이스에 구축했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[더팩트 | 천안=김아영 기자] 단국대 한문교육연구소는 고문헌 속 한자를 90% 이상 인식하는 인공지능을 개발했다고 6일 밝혔다.
단국대 부설 한문교육연구소와 자율형블록체인융합연구소는 고문헌에 표기된 흘림체 글자 등 복잡한 한자에 인공지능 기술을 적용, 한자를 자동으로 분할하고 인식하는 모델을 개발하는데 성공했다.
연구소는 개인 문집류 1259종과 조선왕조실록, 일성록 등에 표기된 1만 593종의 글자를 확인해 3억 80만여자의 한자 이미지를 데이터베이스에 구축했다. 이를 통해 전체 한자의 90% 이상을 판별할 수 있다.
인공지능은 정제된 필사본에 대해서는 뛰어난 해석 성능을 보였지만 초서나 행서 등 흘림 서체에 대해서는 일치율을 높여야 하는 과제가 아직 남았다.
김우정 한문교육연구소장은 "우리 민족의 지식 자산을 우리 기술로 처리하고, 관리하는 시스템을 구축했다는 점에서 의미가 크다"며 "관련 앱도 만들어 국학을 연구하는 학생과 교수, 연구자들에게 제공할 계획"이라고 말했다.
thefactcc@tf.co.kr
발로 뛰는 더팩트는 24시간 여러분의 제보를 기다립니다.
▶카카오톡: '더팩트제보' 검색
▶이메일: jebo@tf.co.kr
▶뉴스 홈페이지: http://talk.tf.co.kr/bbs/report/write
Copyright © 더팩트. 무단전재 및 재배포 금지.
- [대통령 사진의 비밀③] '김건희 사진 조명 논란', 靑 사진 담당 견해는?(영상)
- 국정조사 10일 연장…여야, 3차 청문회 증인 공방 예상
- [속보] 대통령실 "나경원, '자녀 수 따라 대출금 탕감'은 개인 의견일 뿐"
- [팩트체크] 5·18 교과서 삭제…尹일까, 文일까
- '정의연 의혹' 윤미향 징역 5년 구형…"공사 없이 기부금 사용"
- [CES 2023] LGD "프리미엄 차량용 디스플레이 시장 공략 가속화"
- [속보] 이재명, 10일 '성남FC 후원' 檢 조사 출석
- '대마불사' 둔촌주공, 계약률 70% 넘을까?…증권가 '촉각'
- 넥슨 "카트라이더 18년 만에 역사 속으로"…드리프트 시대 개막
- '슬램덩크'→'장화신은 고양이'...극장가 책임질 애니 라인업[TF프리즘]