한은 주요 보고서 12만페이지 디지털화...“AI 언어모델 학습 활용”

한상헌 기자(aries@mk.co.kr) 2024. 7. 5. 17:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국은행이 최근 20년 넘는 기간의 주요 보고서와 문서 등을 디지털화하는 작업을 진행한다.

한은 홈페이지 수록 문서 중 2000년 이후를 대상으로 언어모형 학습 등에 활용하고 의미검색기능을 구현한다는 계획이다.

한은 관계자는 "이번 프로젝트 이후 2000년대 이전 문서까지 과거 데이터까지 더 확장도 고려할 수 있을 것"이라며 "AI가 조금 더 정확한 답변을 할 수 있게 되며, 업무에 AI를 폭넓게 활용할 수 있을 것"이라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

기존 연구 ‘검색증강생성’ 기술 위한 데이터베이스 활용
‘BOK 경제연구’·‘국민계정리뷰’ 등 다양한 연구 담겨
한은 “AI 폭넓게 활용할 수 있을 것 기대”
서울 중구 한국은행 <매일경제DB>
한국은행이 최근 20년 넘는 기간의 주요 보고서와 문서 등을 디지털화하는 작업을 진행한다. 이를 통해 기존 조사·연구 자료를 인공지능(AI)을 통해 보다 더 활용할 수 있게될 전망이다.

5일 한은에 따르면 내부 디지털혁신실은 최근 ‘한국은행 문서 디지털화 사업’ 관련 제안요청서를 공개했다. 디지털혁신실은 한은 업무에 특화된 AI 언어모델 기반 서비스를 개발 중이다. 한은 홈페이지 수록 문서 중 2000년 이후를 대상으로 언어모형 학습 등에 활용하고 의미검색기능을 구현한다는 계획이다.

이번 사업으로 기존 연구 보고서 내용은 검색증강생성(RAG) 기술을 활용하기 위한 데이터베이스로 활용될 전망이다. 검색증강생성은 대규모 언어모델(LLM)에 정보검색 기능을 결합한 기술로, 생성형 AI가 답변을 도출하기 전 외부의 데이터베이스를 통해 관련 정보를 실시간으로 검색하는 기술을 말한다. 이 기술은 생성형 AI의 단점인 할루시네이션(거짓 정보 제공)을 막고 개인 문서나 조직 정보를 기반으로 개인화된 답변을 제공한다.

기존 보고서 문서 형식의 경우 AI가 잘 인식하지 못하는 문제점이 있었는데 이 같은 점이 해결될 것으로 기대되고 있다. 이를 위해 한은은 오는 10월까지 조사 연구 관련 보고서 중 주요 보고서 파일을 기계판독 가능한 포맷으로 변환한다. 은행내 시스템과 원활하게 호환되고, 효과적으로 연계하는 작업도 지원한다. 다양한 종류의 문서 내용을 일관적으로 효과적으로 처리할 수 있는 기술을 활용해 데이터의 접근성과 호환성을 보장한다는 계획이다.

한은 디지털혁신실 관계자는 “기존 파일 형식의 경우 컴퓨터가 텍스트 사이에 있는 각주와 그림을 정확하게 읽지 못하는 한계가 있었다”며 “요약도 잘 안되고, 질문에도 답을 제대로 못 하는 경우가 많아 문서 내용을 그대로 추출하는 게 핵심”이라고 설명했다.

한국은행 문서 디지털화 사업 작업 대상 보고서 <자료=한은>
작업 대상은 2000년 이후 대외 발간된 전체 보고서로 총 2294부, 12만4522페이지 분량으로 한은은 예상한다. 대상 보고서는 ‘BOK 경제연구’, ‘국민계정리뷰’, ‘지역경제보고서’, ‘BOK이슈노트’, ‘통화신용정책보고서’, ‘금융안정보고서’, ‘연차보고서’, ‘경제전망보고서’ 등이다. 이중 연구결과와 분석자료 내용 등이 담긴 ‘BOK 경제연구’가 707부, 4만440페이지 분량으로 전체의 각각 30.8%, 32.5%로 높은 비중을 차지하고 있다.

한은 관계자는 “이번 프로젝트 이후 2000년대 이전 문서까지 과거 데이터까지 더 확장도 고려할 수 있을 것”이라며 “AI가 조금 더 정확한 답변을 할 수 있게 되며, 업무에 AI를 폭넓게 활용할 수 있을 것”이라고 밝혔다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?