‘풀리퀘’는 깃허브에서 타인의 코드에 리뷰를 요청하는 기능인 ‘풀 리퀘스트’의 줄임말입니다. 풀리퀘를 통해 코드는 더 발전하는데요. 알아두면 쓸모 있는 IT업계의 크고 작은 사건들을 변규홍 스켈터랩스 개발자가 격주로 ‘풀리퀘’ 드립니다.

“정부기관이 사용하는 기술은 반드시 모든 사람을 위해 완전히 개방된 상태로 유지되어야 합니다.”
[1] [2] “정부기관의 문서는 HTML5로 발행하세요. PDF 파일로 발행해야 할 때에는 PDF/A 표준을 따르세요. (이 경우에는) 개방된 형식의 파일을 함께 발행해야 합니다.” [3] [4] “(편집 등을 위한) 정부기관의 문서 파일 공유 혹은 협업 시에는 ODF 1.2 표준을 따르세요.” [5] [6]
영국의 정부기관 개방 표준(Open Standards for Government, 이하 개방 표준) 지침에는 위와 같은 내용이 적혀 있다. HTML, PDF, ODF에 대한 자세한 소개와 함께 표준이 마련된 이유, 지침 실천을 위한 구체적인 방법이 자세히 다뤄져 있다. 기계도, 사람도 읽을 수 있도록 하려면 문서 파일 및 관련 기술이 누구나 이용할 수 있는 ‘개방된 상태’(Open)여야 함을 강조하면서, 실무에서 주의해야 할 점도 안내하는 것이다.
개방형문서표준(ODF)의 발전은 지금도 현재진행형
본격적인 이야기에 앞서 잠시 지난 풀리퀘에서 소개한 ODF를 상기해보자. ODF는 지금도 계속 성장 중인 개방형 문서 표준이다. 참고로 ODF에는 ‘odt’ 외에도 스프레드시트 파일 형식인 ‘.ods’(OpenDocument Spreadsheet), 프리젠테이션 파일 형식인 ‘odp’(OpenDocument Presentation) 등이 정의되어 있다. [8] 각각 마이크로소프트 오피스(MS Office)의 엑셀(‘xlsx’), 파워포인트(‘pptx’)에 대응되는 파일 형식이다.
2015년 ODF 1.2 버전이 ISO/IEC 26300 국제표준으로 채택된 데 이어, 2021년 상반기에는 파일 편집 이력 추적, 더욱 강력한 암호화를 비롯해 다양한 개선이 이뤄진 ODF 1.3 버전이 발표되었다. [9] 특히 ODF 1.3버전에서는 MS 오피스와의 호환성도 한층 개선되었다. MS 오피스 자체 형식인 OOXML(Open Office XML)만의 표현 요소들이 ODF 1.3 버전에도 추가된 덕분이다. [10] 재미있는 건 이것이 최근 몇 년간 ODF 표준 개선에 MS도 적극적으로 참여한 결과라는 것이다. [11]
ODF 와 MS의 협력은 10여년 전만 해도 상상하기 어려웠다. 2000년대 초중반에는 OOXML을 ISO/IEC 국제표준으로 등재하는 문제를 두고 ODF 진영과 OOXML 진영의 대립은 마치 '전쟁'을 방불케했기 때문이다. [12] 2006년 MS는 OOXML의 국제표준 등재를 위해 6000여쪽에 달하는 파일 형식 명세를 공개했고 2008년 ISO/IEC 국제표준 등재를 목표로 세웠다. [13] 이는 2006년 앞서 ISO/IEC 국제표준에 등재된 ODF와 함께 ‘복수 표준’으로 등재되는 것을 노린 것이었다. [14]
이 문제를 두고 격렬한 논의와 여론전이 오갔지만 OOXML은 결국 ISO/IEC 국제표준에 등재되었다. MS의 승리였다. 그러나 지금은 MS조차 ODF 발전에 기여하는 방향으로 노선을 선회했다. 과거와 달리 지금은 전세계에 영국처럼 ODF를 표준으로 채택하는 국가들이 늘어나고 있기 때문이다. 즉, ODF 문서에서도 자사 MS 오피스 파일이 잘 호환될 수 있도록 돕기 위한 의도로 풀이된다. 한편으로는 강력한 개방형 표준 문서 형식으로서 ODF의 위상을 체감해볼 수 있는 대목이다.
유니코드, ODF에 이어 CSV까지… 의미 있는 개방을 추구하는 영국 정부
영국에는 2011년 출범한 GDS(Government Digital Service), 이후 여기서 분리되어 나온 CDDO(Central Digital and Data Office)라는 두 정부 기관이 있다. GDS는 영국 정부기관의 IT 인프라 및 서비스 운영을 담당하며, CDDO는 영국 정부기관의 디지털 기술과 데이터에 관한 전략과 표준 수립을 담당한다. [15] 예를 들어 영국 정부 홈페이지 'gov.uk' 운영은 GDS의 몫이다.
아래 <그림 1>은 GDS의 트위터 계정의 화면을 캡쳐한 것으로, GDS의 역할을 상징적으로 드러내고 있다. [16] 그리고 주목할 건 GDS와 CDDO의 활동은 깃허브(Github)를 통해 오픈 소스로 공개되고 있다는 것, 이에 따라 자연스럽게 시민들의 참여도 이어지고 있다는 점이다. [17] [18]

2011년의 GDS 출범 이후 영국 정부는 대국민 정부 IT 서비스 혁신을 위해 정부기관 개방 표준 원칙(Open Standards Principle)을 수립했다. 이에 따라 2012년 공공기관, 학계, 산업계가 모두 참여하는 개방 표준 위원회(Open Standards Board)도 설치됐다. [19]
이어 2013년, 500명 남짓한 시민들도 참여한 가운데 유니코드 UTF-8 인코딩부터 ‘개방 표준’이 마련되기 시작했다. [20] 인코딩부터 표준을 마련은 기본적인 인코딩 방법부터 통일되지 않으면 제대로 된 이름이 표시되지 않는 등 민감한 영역에서 문제가 발생할 수 있기 때문이다. [21] 이후 2014년에는 ‘발행 문서’, ‘공유 문서’를 다루면서 ODF도 ‘개방 표준’으로 정해졌다. [22] [23]
하나 둘씩 ‘개방 표준’이 마련되면서, 통계자료 등 순수한 표 형식의 자료는 아예 CSV(Comma Separated Values) 파일 형식을 사용하도록 명시했다. [24] CSV 파일 형식은 윈도우의 기본 내장 메모장 등의 텍스트(Text) 파일 편집기에서 열어볼 수 있는, 표 형태의 자료를 각 칸별로 쉼표로 구분하여 나열하는 방식이다.
CSV 파일 형식에 대한 개방 표준은 자칫 놓치기 쉬운 구체적인 사항도 엄밀하게 다루고 있다. MS 오피스의 엑셀은 CSV 파일 형식을 다룰 때 한 가지 주의해야 할 사항이 있다. 유니코드 UTF-8 인코딩으로 저장할 경우 파일의 맨 앞에 BOM(Byte-Order-Mark)을 추가하며, BOM이 없는 파일을 다룰 때는 ‘가져오기’라는 기능을 써야만 한다는 점이다.
BOM이란 유니코드의 여러 인코딩 방식이 혼용될 경우에 대비하여, 파일의 맨 앞에 어떤 유니코드 인코딩인지를 식별할 수 있는 특수문자를 2-3글자 추가하는 방식을 말한다. 하지만 2013년에 유니코드 UTF-8 ‘개방 표준’을 정할 때 BOM을 쓰지 않도록 정했기 때문에, CSV 파일을 다룰 때 엑셀을 사용한다면 추가적인 작업이 필요하다. CSV 파일을 소개하는 ‘개방 표준’의 ‘지침’에서는 이 지점들을 명시적으로 소개하며 구체적인 작업 절차를 서술하고 있다.
‘개방 표준’에 따른 정부기관의 실무를 총괄하는 GDS, ‘개방 표준’의 수립 및 유지보수 과정을 총괄하는 CDDO는 이처럼 ‘개방 표준’ 및 이에 따른 실무 지침을 굉장히 자세하게 정리해 두고 있다. 또한 이에 관해 정부 블로그를 통해 지속적인 홍보도 이어가고 있다. PDF 파일은 종이에 인쇄하는 것을 기준으로 만들어져 있다는 점을 지적하며, 잘못 만들 경우 시각장애인 등을 위한 스크린리더(화면에 적힌 글씨를 소리 내 읽어주는 프로그램) 등이 작동되지 않을 수 있음을 소개하고, 가급적 HTML을 사용할 것을 권한다. [25]
또한 실무 지침의 내용은 단순히 파일 형식에만 국한되지 않는다. 어떤 어휘를 써서 문서를 작성해야 하는지에 대해서도 구체적인 이유와 함께 지침을 준다. 예를 들면 문장 내 단어 수가 25단어를 초과하지 않아야 한다고 하고, 문서 내에 포함되는 표는 최대한 단순한 구조여야 한다고 제한한다. 부득이 PDF 파일을 사용할 때 주의할 사항 등을 모두 상세하게 설명한다. [26]
ODF 파일 사용에 관한 지침도 사려깊다. 윈도우, 리눅스 등 서로 다른 환경에서도 같은 내용이 보이는지를 확인해야 한다는 점을 명시한다. ODF 파일 형식 자체의 한계로 인해 주의해야 하는 지점도 소개한다. 심지어 ODF 표준 발전 과정에 참여할 수 있는 방법까지 소개한다. [27] 지침의 마련 과정은 물론 그 속에 깃든 철학, 실무자가 알아야 하는 사항들을 놓치지 않을 수 있게 해 준다.
‘개방 표준’ 마련 후 4년간의 변화
이러한 ‘개방 표준’에 대한 지침은 실질적인 변화로 이어지고 있을까? 2018년 4월 27일자 영국 정부 기술 블로그 포스팅을 같이 읽어보자. [28] <그림 2>는 2018년 1사분기동안 영국 정부 홈페이지에서 시민들이 다운로드한 파일들의 형식에 대한 통계이다. ‘개방 표준’이 된 CSV의 빈도가 가장 높지만, 전체적으로는 개방 표준이 아닌 파일들의 비중이 높은 편임을 확인할 수 있다.

ODF 도입 이후에도 doc, xlsx, docx 파일의 비중이 높은 이유는 뭘까. 이에 대해 영국 정부는 ‘개방 표준’ 도입 이전에 생산된 문서들의 경우 아직 ODF로 변환되지 못한 것이 많다는 점을 짚는다. 이를 뒷받침하는 근거로, 2년 간 홈페이지에 새로 게시된 파일들의 ‘개방 표준’ 준수 여부에 대한 월별 통계를 <그림 3>처럼 제시한다. 2016년 1월부터 2017년 12월까지의 추세를 보면, 실질적으로 2017년 9월을 기점으로 ‘개방 표준’인 문서의 비율이 그렇지 않은 것을 넘어섰다. 물론 여전히 ‘개방 표준’을 따르지 않는 문서의 비율은 낮지 않다. 그래도 선언에서만 그치지 않고 실질적인 변화를 위해 지속적인 노력이 있음은 짐작할 수 있다.

CDDO와 GDS의 깃허브(Github) 오픈 소스 저장소에서는 수많은 시민들의 ‘풀리퀘’(Pull Request)를 찾아볼 수 있다. 여기에는최소한 정부기관만큼은 누구에게나 열린 문서를 제공해야 한다는 원칙이 담겨있다. 그 원칙을 구체적으로 실현하기 위한 영국 정부의 노력들은 현재진행형이다.
아울러 '정부기관이 사용하는 기술은 반드시 모든 사람을 위해 완전히 개방된 상태로 유지되어야 한다'라는 처음 구절을 상기해보자. 문서는 결국 기계든, 사람이든 누구든 읽기 편한 상태로 제공되어야 한다. 그리고 당신이 일상에서, 혹은 업무 중 제공하거나 읽게 되는 문서들은 과연 모두의 편의를 생각한 결과물인지 한번쯤 고민해보면 어떨까?

[1]:영어 원문은 “Government technology must remain open to everyone.” 이다.
[2]:https://www.gov.uk/government/publications/open-standards-principles/open-standards-principles
[3]:영어 원문은 “Use the HTML5 standard to publish government documents. If you need to publish a PDF, make sure it is PDF/A.”이다.
[4]:https://www.gov.uk/government/publications/open-standards-for-government/viewing-government-documents
[5]:영어 원문은 “Use the ODF 1.2 Open Document Format (ODF) standard for sharing and collaborating on documents in government.”이다.
[6]:https://www.gov.uk/government/publications/open-standards-for-government/sharing-or-collaborating-with-government-documents
[7]:https://www.bloter.net/newsView/blt202206170014
[8]:https://ko.wikipedia.org/wiki/%EC%98%A4%ED%94%88%EB%8F%84%ED%81%90%EB%A8%BC%ED%8A%B8
[9]: https://blog.documentfoundation.org/blog/2021/06/23/odf-1-3-is-an-oasis-standard/
[10]: https://insider.office.com/en-us/blog/office-apps-now-support-opendocument-format-odf-1-3
[11]: https://www.oasis-open.org/committees/membership.php?wg_abbrev=office
[12]: https://www.ddaily.co.kr/news/article/?no=36038
[13]: https://zdnet.co.kr/view/?no=00000039167360
[14]: https://en.wikipedia.org/wiki/Standardization_of_Office_Open_XML
[15]: https://slownews.kr/82841
[16]: https://twitter.com/gdsteam
[17]: https://github.com/alphagov
[18]: https://github.com/co-cddo
[19]: https://m.blog.naver.com/lugenzhe/90172323158
[20]: https://www.gov.uk/government/news/first-open-standards-for-government-technology-endorsed
[21]: 앞선 두 풀리퀘에서 다뤘던 주제이다. https://www.bloter.net/newsView/blt202205060153 https://www.bloter.net/newsView/blt202205200075
[22]: https://www.gov.uk/government/news/open-document-formats-selected-to-meet-user-needs
[23]: https://scienceon.kisti.re.kr/srch/selectPORSrchTrend.do?cn=IWT201408065
[24]: https://www.gov.uk/government/publications/recommended-open-standards-for-government/tabular-data-standard
[25]: https://gds.blog.gov.uk/2018/07/16/why-gov-uk-content-should-be-published-in-html-and-not-pdf/
[26]: https://www.gov.uk/guidance/publishing-accessible-documents
[27]: https://www.gov.uk/guidance/using-open-document-formats-odf-in-your-organisation
[28]: https://technology.blog.gov.uk/2018/04/27/open-document-format-in-government-an-update/
Copyright © 블로터