한자투성이 고서, AI로 번역
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
"강헌대왕(태조 이성계의 존호)이 하늘의 명을 받아 한양에 도읍을 정하고, 강토를 개척해 8도라 칭했다. 사방의 복판에 있는 것을 경기라 하고 남쪽에 치우친 것은 전라, 동남은 경상이라 하였다."
인공지능(AI) 기술을 활용해 조선시대 지리지 동국여지승람 일부를 한글로 번역한 내용이다.
옛날 한자로 쓰인 방대한 분량의 고서를 번역하는 AI 서비스가 처음 개발됐다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
고문자 인식 정확도 92% 달해
“강헌대왕(태조 이성계의 존호)이 하늘의 명을 받아 한양에 도읍을 정하고, 강토를 개척해 8도라 칭했다. 사방의 복판에 있는 것을 경기라 하고 남쪽에 치우친 것은 전라, 동남은 경상이라 하였다.”
인공지능(AI) 기술을 활용해 조선시대 지리지 동국여지승람 일부를 한글로 번역한 내용이다. 옛날 한자로 쓰인 방대한 분량의 고서를 번역하는 AI 서비스가 처음 개발됐다.
한국전자통신연구원(ETRI)은 한국콘텐츠진흥원 등과 함께 ‘AI 기반 고서 번역 기술’을 개발해 실증하고 있다고 21일 밝혔다. 고서 번역가들은 오랜 시간에 걸쳐 낡은 장서 원문의 희미한 글자를 일일이 확인해 한글 번역서를 완성한다. ETRI는 이 작업 시간을 대폭 줄일 수 있는 기술을 개발했다. 다양한 모양의 한자 1000만여 개 데이터를 학습해 AI 인식 및 번역 플랫폼을 구축했다. 한자 인식 정확도는 92%, 번역 정확도는 85%로 알려졌다. 인식 알고리즘은 시각 정보 해석에 특화된 컨볼루션신경망(CNN)을, 번역 알고리즘은 재귀신경망(RNN)을 사용했다.
이 플랫폼은 번역가들이 공동 작업을 할 수 있게 특수용어 공유 기능 등을 갖췄다. 이달부터 국립중앙도서관, 국회도서관 등 전국 11개 도서관의 키오스크에 설치됐다. 연말께 선보일 정식 서비스에선 3만여 종의 고서와 수십만 점의 고문서 번역이 가능할 전망이다. 현재는 동국여지승람을 비롯해 동래군지, 산청읍지 등 지리지 중심 번역 서비스를 제공하고 있다. 일반인들이 휴대폰에서 고서 번역본을 읽을 수 있는 모바일 앱도 선보일 예정이다.
연구 책임자인 민기현 ETRI 인공지능융합연구실 책임연구원은 “이번 개발 과정에서 세종실록지리지 안에 독도가 한국 땅이라는 명확한 근거를 봤다”며 “지리지 안에는 지역 문화 등 풍속과 특산물, 인물 등 귀중한 정보가 많이 담겨 있다”고 말했다. ETRI는 번역된 고서의 스토리를 모션센서 등으로 체험할 수 있는 실감형 인터랙티브 콘텐츠도 개발할 계획이다.
이해성 기자 ihs@hankyung.com
▶ 클래식과 미술의 모든 것 '아르떼'에서 확인하세요
▶ 한국경제·모바일한경·WSJ 구독신청하기
Copyright © 한국경제. 무단전재 및 재배포 금지.
- "외인들 수건 던지고 있다"…'250조 유출' 초비상 걸린 중국
- "개 먹는 나라가 무슨…" 비난하던 외국, 이젠 배우러 온다
- "이러다 죽겠다" LG 임원의 탄식…2년 만에 6조 '잭팟' 반전 [김익환의 컴퍼니워치]
- "고향갈 때 최고다"…추석 앞두고 불티나게 팔린 '중고차'
- "진짜 고기가 아니라고요?"…한 입 베어 물었더니 '깜짝'
- "수리비 125만원, 말이 되나"…아이폰 박살 낸 中 유명 배우
- "블랙핑크는 왜 깜깜무소식이냐"…속타는 YG엔터 개미들
- '산골처녀' 中 인플루언서 알고보니…각본 따라 움직인 연예인
- 외국인도 먹방서 감탄…'세계 최고 볶음요리' 된 한국 음식
- 中 동물원 또 '가짜 곰 논란'…"등 대고 누워 방문객에 인사"