문서서 공공데이터 뽑는다..행안부, 개방형 문서 포맷 전환 첫 발

최호 2022. 5. 25. 14:25
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

정부가 공공문서의 개방형 포맷 전환에 착수했다.

개방형 포맷은 데이터를 바로 추출해서 활용할 수 있는 문서 형식으로, 공공 빅데이터 구축·활용 기반을 마련하기 위한 포석이다.

국가 행정에 개방형 문서를 도입해서 빅데이터 수집 기반 마련에 착수한 것은 세계 최초다.

행안부는 개방형 문서에서 효율적으로 데이터를 추출할 수 방안 마련에도 착수했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

정부가 공공문서의 개방형 포맷 전환에 착수했다.

개방형 포맷은 데이터를 바로 추출해서 활용할 수 있는 문서 형식으로, 공공 빅데이터 구축·활용 기반을 마련하기 위한 포석이다. 국가 행정에 개방형 문서를 도입해서 빅데이터 수집 기반 마련에 착수한 것은 세계 최초다.

행정안전부는 공무원용 그룹웨어 '온나라시스템'의 첨부 파일을 개방형 포맷으로만 사용하기로 하고 시범 운영에 들어갔다고 25일 밝혔다.

산하 기관에 △한컴오피스 2010 버전 이상 일괄 업데이트 △개방형 포맷(HWPX) 열람 불가 시 조치 방안 내부 공지 등을 골자로 한 협조 요청 사항을 발송했다.

개방형 문서는 한글, 워드, 엑셀 등 문서 파일 가운데 기술표준이 외부에 공개돼 있어 문서 내부 구조를 쉽게 확인할 수 있는 파일이다. 확장자는 ODT, DOCX, HWPX, XLSX 등이다.

사람이 일일이 파일을 열지 않고도 특정 프로그램 등으로 파일 내 데이터를 확인하고 추출할 수 있게 된다. 기계에서 판독하거나 다양한 시스템과 도구에서 재가공·재수정할 수 있다.

행안부의 이번 조치는 공공문서 내 데이터를 대량으로 빠르게 수집·분석하는 게 목적이다. 새 정부가 표방하는 디지털플랫폼정부 구현과도 맞닿아 있다.

문서 중심 행정 시스템을 갖춘 우리나라는 지난 30여년 간 공공부문에서 폐쇄형 문서 포맷을 사용해 왔다. 문서에서 방대한 데이터가 쏟아지지만 폐쇄형 문서에선 이를 제대로 수집, 활용하기 어렵다는 지적이 따라왔다. 문서에서 데이터를 추출하는데 필요한 광학문자판독(OCR) 등 기술이 폐쇄형 문서에서 제대로 실행되지 않기 때문이다.

개방형 문서는 이러한 문제를 해결하기 위한 수단으로 주목받는다. 공공부문에서 발생하는 문서 내 데이터를 수집하고 효율적으로 분석할 수 있으면 다양한 공공서비스를 창출하고 양질의 데이터를 민간이 이전할 기회가 늘어난다.

행안부는 개방형 문서에서 효율적으로 데이터를 추출할 수 방안 마련에도 착수했다. 최근 문서 편집기와 인공지능(AI), 데이터 활용 관련 업체와 다양한 데이터 추출 방안을 마련하고 있는 것으로 확인됐다.

업계 관계자는 “문서, 데이터 활용 측면에서 개방형 문서 도입 필요성이 증가하면서 정부도 변화를 선택한 것”이라며 “다양한 민간업계와 개방형 문서를 효율적으로 활용할 수 있는 방안을 논의 중으로 온나라시스템 기능 업그레이드를 포함한 다양한 방안이 거론되고 있다”고 말했다.

행안부는 '온나라시스템' 시범 사업에 이어 전 부처를 포함한 공공부문 전반에 걸쳐 개방형 문서 사용을 확대할 계획이다.

행안부 관계자는 “행정 문서의 데이터 분석에 시스템적으로 접근하는 기반을 마련하기 위한 과정”이라며 “디지털시대에 맞는 데이터 활용이 중점 과제로 부상한 상황에서 행정문서를 데이터 활용에 반영할 수 있도록 다양한 개편을 준비하고 있다”고 설명했다.

최호기자 snoop@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?