“한 달 작업 하루 만에”…한자 띄어쓰기 AI 개발
[KBS 대구] [앵커]
옛 문헌의 한문을 자동으로 띄어쓰기해주는 프로그램이 국내에서 처음으로 개발됐습니다.
한자 기초 번역부터, 디지털로 만들기까지 걸리던 시간이 크게 줄 것으로 기대됩니다.
김지홍 기자가 보도합니다.
[리포트]
옛 문헌을 스캔한 이미지 파일을 컴퓨터 프로그램에 띄웁니다.
전체 한자를 인식해 디지털 텍스트로 옮긴 뒤, 단 2~3초 만에 자동으로 문장 띄어쓰기를 해줍니다.
한국국학진흥원이 국내 최초로 개발한 인공지능 기반의 한문 자동 문장 분절 프로그램입니다.
[정재석/한국국학진흥원 국학기반본부 팀장 : "번역해야 할 (전통기록유산) 자료가 굉장히 많이 남아있습니다. 인공지능을 활용해서 쉽게 사람이 이해하기 쉽게 하도록 이 프로그램을 개발하게 됐습니다."]
한문 번역에 있어 분절은 번역 정확도를 가르는 핵심 과정입니다.
문맥을 파악해 우리말로 바꾸는 기초가 되기 때문입니다.
1억 자가 넘는 분절 문장을 학습한 AI의 작업 정확도는 90% 이상.
사람이 일일이 컴퓨터에 입력하고 검수하면 한 달 걸릴 분량을 단 하루 만에 끝낼 수 있습니다.
획을 흘려 쓴 서체까지는 아직 전부 반영하지 못하지만, 데이터가 축적되면 곧 해결될 것으로 예상됩니다.
[박나연/한국국학진흥원 콘텐츠정보팀 전임연구원 : "내년부터는 저희가 본격적으로 번역 사업을 시작합니다. 그래서 자동번역이 되면 일반인들이 누구나 쉽게 고문서에 대한 정확한 정보를 알 수 있습니다."]
내년에 프로그램이 일반에 공개되면, 집 깊숙이 방치됐던 족보나 고서 같은 옛 글들도 누구나 쉽게 풀이할 수 있게 될 것으로 보입니다.
KBS 뉴스 김지홍입니다.
촬영기자:최동희
김지홍 기자 (kjhong@kbs.co.kr)
Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지
- 가상의 ‘서울 공습 영상’ 논란…이스라엘 대사관 하루 만에 삭제 [잇슈 SNS]
- 타다 기사는 근로자인가?…타다는 멈췄지만 소송은 진행 중
- “여행 망쳐 놓고” 외국 국적 항공사 소비자 피해 대응 미흡
- “욕하고, 신발로 때리고”…조합장 법 위반 무더기 적발
- 러, 한국 ‘수출 제한’ 조치에 보복 경고 “놀라지 말길”
- 황희찬, 시즌 첫 멀티골로 승리 견인
- “유리인 줄 알았어”…미 공원서 4.87캐럿 다이아몬드 ‘횡재’ [잇슈 SNS]
- 미 아이스하키장에 내린 ‘사랑의 인형 비’ [잇슈 SNS]
- “연말이라 접수 안돼요”…버스회사의 황당한 보험관리 꼼수 [제보K]
- 충돌구, 달 전체지도 촬영…달 구석구석 관측한 ‘다누리’