불은 껐지만 복구는 언제··· ‘세계 1위 전자정부’의 현실

김동인 기자 2025. 10. 20. 06:48
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

국가정보자원관리원 화재의 여파가 계속되고 있다. 정부는 4주 내로 복구하겠다는 입장이지만 시간이 더 걸릴 수도 있다. 재해 발생 시 여파를 예상했지만 적극적으로 대비하지 못했다.
10월1일, 국가정보자원관리원 대전 본원 앞에서 관계자들이 배터리를 담은 수조를 정비하고 있다. ⓒ시사IN 이명익

9월26일, 대전광역시에 위치한 국가정보자원관리원(국정자원) 본원 전산실 화재의 여파가 계속되고 있다. 불은 약 22시간 만에 완전 진화했지만, 정부가 운영하는 각종 전산 시스템 상당수가 가동을 중단했다. 이번 사태는 ‘세계 1위 전자정부 시스템’을 자랑하던 국가 전산망에 대한 신뢰에 금이 가는 사건으로 기록되었다.

당초 이번 화재의 영향을 받은 서비스는 647개로 알려졌다. 그러나 피해 14일 차인 10월9일, 중앙재난안전대책본부(중대본)는 실제 피해를 본 서비스의 수를 709개로 정정했다. 국정자원 내부 관리시스템인 엔탑스(nTOPS)가 뒤늦게 복구되면서 피해 서비스 집계에도 차이가 있었던 것으로 드러났다. 중대본에 따르면, 이날까지 복구된 서비스는 27.2%(197개)다. 전체 피해 서비스 가운데 가장 중요한 1등급 서비스의 피해 규모는 총 40개이며, 이 중 25개만 정상화된 상태다.

3년 전 호언장담이 무색해졌다. 이번 국정자원 화재는 데이터센터에서 배터리 화재가 발생했고, 즉각적인 복구가 이뤄지지 못했다는 점에서 2022년 ‘카카오 사태’와 유사하다. 2022년 10월15일, 경기도 성남시에 위치한 SK C&C 데이터센터에 화재가 발생하면서 ‘국민 메신저’로 불리던 카카오톡과 카카오가 운영하는 각종 서비스가 먹통이 된 사건이다.

당시 정부 전산망에서도 유사한 문제가 발생할 것을 우려하는 목소리가 이어지자, 강동석 국가정보자원관리원장은 2022년 10월19일 직접 브리핑에 나서며 이렇게 반박했다. “대전 센터가 화재가 날 경우 재해복구 시스템은 실시간 백업된 자료로 3시간 이내 복구할 수 있다.” 구체적인 상황 예시와 복구 소요 시간을 호언장담한 강 원장은 “재해복구 전용 기능을 수행하는 공주 센터를 2024년부터 운영할 것”이라는 계획도 내세웠다. 그러나 3년 뒤 실제 사고가 발생하자 ‘화재 발생 시 3시간 이내 복구’라는 약속은 지켜지지 못했고, 이미 2023년에 완공한 공주 센터도 아직 운영하지 못하고 있다.

예상 불가능한 참사는 아니었다. 이번 화재 사건 직후 가장 논란이 된 것이 재해복구(DR, Disaster Recovery) 체계와 ‘액티브-액티브(Active-Active)’ 방식의 이중화 시스템이 미비했다는 점이다. 용어상 혼란을 정리하자면 이렇다. 데이터센터가 화재나 지진 같은 재해에 맞닥뜨렸을 때, 서비스를 정상으로 돌리는 총체적인 방식을 재해복구(DR) 과정이라 부른다. 서비스를 복원하는 총체적인 ‘사후 수습’ 체계다. 민간 IT 플랫폼 기업들 사이에서는 서비스 정상화의 속도와 복구 이후의 안정성이 곧 기업의 수익 및 시장 신뢰도와 직결되기 때문에 이 분야에 대한 투자가 점점 중요시되고 있다.

10월8일, 윤호중 행정안전부 장관이 화재가 발생한 국가정보자원관리원 대전 센터 복구 현장을 찾았다. ⓒ행정안전부 제공

한편 ‘사전 대비’ 측면에서 데이터센터(서버)의 이중화 방안으로 액티브-액티브 방식이 대두되고 있다. 단순화하자면 이렇다. 정부 서비스에 접속할 때부터 일부 이용자는 대전 센터로, 또 다른 일부는 다른 센터로 보내면서, 두 센터에서 모두 같은 전산 서비스가 이뤄지는 방식이 액티브-액티브 개념이다. 이렇게 대비할 경우, 한쪽 데이터센터에 문제가 생기더라도 다른 쪽 데이터센터를 통해 서비스가 지속될 수 있다. 이는 단순히 ‘백업을 잘 해둔다’는 개념과는 다르다. 동시에 같은 서비스가 이뤄지기 위해서는 이중화하는 데이터센터의 물리적 거리도 가까워야 한다. 상당한 투자가 이뤄져야 하는 대비책이다.

그러나 정부 전산망에 대한 이 같은 투자는 뒷전이었던 것으로 밝혀졌다. 2025년 국정자원 예산은 5559억원인데, 이 중 재해복구 예산은 30억원, ‘액티브-액티브’ 이중화 예산은 24억원 수준인 것으로 알려졌다.

여기에는 두 가지 이유가 있다. 우선 2023년 11월에 발생한 국가정보통신망 마비 사태의 여파다. 당시 정부24를 비롯해 189개 행정정보시스템에서 동시다발적 장애가 발생했는데, 네트워크 장비 중 하나인 라우터의 고장이 그 원인이었다(〈시사IN〉 제847호 ‘아직도 원인을 모른다, 그게 진짜 재난이다’ 기사 참조). 고장난 장비는 도입한 지 8년이 된 노후 장비였다. 이후 같은 사태를 막기 위한 장비 교체 요구가 컸고, 장애 발생 위험도가 높은 장비를 교체하는 데 예산의 상당 부분을 편성했다는 것이다.

‘액티브-액티브’ 이중화가 더딘 것은 정부가 아직 ‘결단’을 내리지 못했기 때문이다. 2024년 7월, 행정안전부는 국정자원에서 액티브-액티브 이중화 도입에 대해 검증을 시작했다고 알렸다. 재해복구(DR) 시스템에 대한 전반적인 제고 역시 지난해 추진해온 내용이다. 당시 정부는 “대전 센터의 재해·재난 발생 시”를 가정하며, 곧바로 광주 센터에서 정부 전산 서비스가 이어지도록 하겠다고 설명했다. 즉, 재해 발생 시 초래될 각종 서비스 장애를 이미 어느 정도 예상하고 대응책을 마련해가던 중이었다. 하지만 정부 정책의 특성상 각종 시범사업 이후 예산 편성이 이뤄질 터라 빠른 실행으로 이어지지 못했고, 결과적으로 재해가 대비책 실행에 앞서 찾아왔다.

‘G드라이브’ 복구할 수 없게 돼

당초 예상하지 못한 대규모 데이터 유실 사태도 뒤따랐다. 화재 발생 엿새째인 10월1일, 정부는 전소된 시스템 가운데 공무원들이 업무상 활용하는 자료 저장 클라우드인 ‘G드라이브’가 포함되어 있으며, 이 시스템을 복구할 수 없게 되었다고 발표했다. 대용량 파일 ‘저장용’이라는 이유로 외부 백업 시스템이 갖춰지지 않은 것으로 알려졌다.

이번 국정자원 화재 사태는 신속한 복구가 어렵다는 점 때문에 한국 정부의 IT 역량에 대한 실망으로 이어졌다. 그럼에도 불구하고 대규모 데이터가 유실되지는 않았다는 점 때문에 사고 초기까진 ‘사초가 사라졌다’는 비판으로 곧장 이어지지 않았다. 하지만 ‘G드라이브’ 전소 사태는 자료 원본이 사라진 셈이라 문제가 달랐다. 이번 화재로 74개 기관에서 19만1000여 명의 업무 파일 858테라바이트(TB)가 소실된 것으로 알려졌다.

부처 간 피해 규모는 다르다. 한 정부 부처 사무관은 “G드라이브는 부처마다 사용하는 정도가 다르다. 우리 부처의 경우 업무용으로 만든 파일들은 대부분 개인 PC에 파일을 보관한다”라고 설명했다. 그러나 인사혁신처와 같은 일부 기관은 개별 공무원의 업무 자료를 정책상 G드라이브에만 저장하고 있어서 업무상 피해가 불가피한 상황이다.

사태 초기 정부가 예상한 정부 전산 서비스 복구 소요 기간은 4주였다. 하지만 일부 시스템은 4주 만에 복구하기 어려우리라는 전망도 나온다. 10월1일 김민재 행안부 차관도 “일부 시스템은 여러 기관과의 정보 연계 등으로 예상한 시간보다 더 걸릴 수 있다”라고 언급했다.

일단 서비스 오픈 뒤 수정하는 관행

특히 행정 관련 전산 시스템이 갈수록 ‘대규모화’하고, 시스템 간의 연동성이 강화된다는 점 때문에 정부의 시스템 복구에 대한 우려가 뒤따르고 있다. 화재 발생 나흘째인 9월29일, 감사원은 ‘대국민 행정정보시스템 구축·운영실태’ 주요 감사 결과를 발표했다. 2023년 11월 국가정보통신망 마비 사태를 기점으로 정부의 각종 IT 서비스 실태를 감사한 결과였다. 그런데 이 감사 결과에 주목할 만한 또 다른 대목이 있다. 바로 공공 IT 서비스 개발 과정에서, 특히 대규모 시스템 구축 사업에서 품질을 제대로 확보하지 못하고 있다는 지적이다.

화재 발생 셋째날인 9월28일, 서울 시내 한 우체국에 전산 장애를 알리는 안내문이 붙어있다. ⓒ연합뉴스

감사원은 이 보고서에서 “막대한 재원을 투입해 구축한 대규모 시스템일수록 만성적인 사업 기간 부족을 초래하고, 기한에 쫓겨 충분한 테스트나 오류 수정이 이뤄지지 못한 채 그대로 개통해 대량의 오류 발생을 반복했다”라고 지적한다. 이를 풀어보면 이렇다. 공공부문에서 IT 관련 사업비가 낮게 책정되고, 이로 인해 우수한 업체는 사업에 입찰하지 않고, 기술력이 부족하거나 영세한 업체에게 시스템 개발을 맡기는 실정이 뒤따른다. 특히 소프트웨어 산업은 코로나19 팬데믹 이후 ‘개발자 몸값 상승’ 문제가 대두될 만큼 실력 있는 개발자에 대한 인건비가 급증한 상태다. 그만큼 개발 단가는 올라갔지만, 예산은 그만큼 늘리지 못하는 구조가 이어지고 있다.

이는 중소 SI(시스템통합) 업체들 사이에서 오래전부터 제기되어온 문제다. 적정 비용이 반영되지 못하면서 IT 서비스의 ‘오류 발생 확률’이 그만큼 증가한다. 오류를 잡아내고 수정할 만한 테스트 기간도 확보하기 어렵고, ‘일단 서비스를 오픈한 뒤 계속해서 수정’하는 관행이 이어진다. 이런 환경에서 제작한 정부의 각종 IT 서비스가 이번 화재로 인해 구동 환경이 바뀌었을 때, 어떤 오류가 발생할지 예상하기 어렵다는 난점이 있다.

10월9일 기준, 공무원 업무 인트라넷인 온나라시스템 등이 복구되었지만, 주요 부처의 IT 시스템은 여전히 작동하지 않아 혼란이 계속되는 중이다. 이러한 혼란은 10월13일부터 시작되는 올해 국정감사에까지 영향을 미치고 있다. 각 의원실이 부처에 자료를 요구해도, 시스템 복구가 되지 않았다는 이유로 자료 제출이 지연되고 있기 때문이다. 이런 와중에도 가장 주목받는 국감 현장은 행정안전위원회가 될 가능성이 높다. 행안부 국정감사에서 이번 화재 사건과 정부 IT 시스템의 총체적인 부실이 비중 있게 다뤄질 전망이다.

김동인 기자 astoria@sisain.co.kr

▶읽기근육을 키우는 가장 좋은 습관 [시사IN 구독]
▶좋은 뉴스는 독자가 만듭니다 [시사IN 후원]
©시사IN, 무단전재 및 재배포 금지

Copyright © 시사IN. 무단전재 및 재배포 금지.