[단독]`행정망 마비` 전날, 인증장비만 손본 게 아니다

안경애 2023. 11. 18. 16:04
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인증서버·새올·네트워크장비…'행정망 마비' 원인 미스테리

국가 행정망 마비가 정부 인증시스템과 연결된 네트워크장비 문제가 아닐 가능성이 제기된다. 국가정보자원관리원의 조정이나 기업간 정보공유가 부족한 상태에서 제각각 장비나 시스템 변경이 이뤄지다 보니 문제 발생에 취약할 뿐 아니라 원인 파악도 난항을 빚고 있다.

18일 정부 행정시스템 장애가 이틀째 이어지는 가운데 본지 취재 결과, 장애 발생 전날인 16일 대전 정부통합데이터센터에서 인증시스템에 연결된 네트워크장비 변경 작업 외에 인증서버도 백신 관련 업데이트 작업이 있었다. 같은 날 지자체 일선에서는 공무원 전용 행정시스템인 '새올'의 서버 업데이트 작업도 진행됐다. 대전 통합데이터센터에서는 다수의 장비 배치 변경도 국가정보자원관리원 지시로 이뤄졌다. 이들 작업은 각 기관간 정보공유나 국가정보자원관리원의 종합조정이 부족한 채 제각각 이뤄진 것으로 확인됐다.

◇인증시스템서 시작돼 새올·정부24로 문제 확산

업계와 관련 기관에 따르면 행정망 장애는 17일 아침 행정안전부 국가정보자원관리원이 운영하는 대전 데이터센터의 인증시스템에서 시작돼 GPKI(정부 공개인증서), NPKI(국가 공인인증서) 등 전체 인증 문제로 확산됐다. 특히 지자체 공무원 전용 행정시스템인 '새올'이 17일 아침 사용자 인증 등에 장애를 일으키고 이날 오후 정부 민원발급 서비스인 '정부24'까지 멈춰 서며 지자체 현장의 업무마비와 온·오프라인 민원발급 중단으로 확산됐다. 이중 인증시스템 문제는 17일 저녁 대부분 해결됐다. 그런데 행안부에 따르면 새올은 이후에도 문제가 잡히지 않았다.

초기에 부각된 사태의 발단은 정부 인증시스템과 연결된 네트워크장비 문제다. 네트워크장비의 소프트웨어 업데이트를 위한 패치작업 후 문제가 발생했다는 것.

익명을 요구한 한 IT업계 관계자는 "국가정보자원관리원은 센터별로 유지관리 사업자를 선정해서 장비와 소프트웨어를 관리하는데, 대전센터 보안통신 인프라 유지관리 사업자는 중견 SI기업인 D사이고, 패치 작업을 한 장비는 인증시스템과 연동되는 국내 보안장비 기업 P사의 L4(레이어4) 네트워크장비"라고 밝혔다. 이어 "L4 장비의 소프트웨어 패치 작업을 하다가 문제가 발생했고, 이후 서버 재부팅 등 여러 조치를 했음에도 복구가 안됐다"고 말했다.

L4는 네트워크장비 중에서도 부하분산(로드밸런싱)을 주로 처리하는 장비다. 네트워크 트래픽을 여러 장비로 분산시켜 원활하게 서비스가 운영되도록 돕는다. 이를 통해 민원발급 등의 요청을 분산시킴으로써 특정 서버에 부하가 집중되지 않도록 한다. 이번 사태는 정부시스템의 관문 역할을 하는 인증시스템에서 발생한 문제가 정부 민원서비스 장애로 이어졌다는 분석이 제기돼 왔다. 다만 인증시스템은 17일 저녁께 대부분 정상화된 것으로 알려졌다.

◇"인증서버도 장애 전날 작업 있었다"

이 가운데 네트워크장비를 공급한 P사는 다른 쪽의 문제 가능성을 주장하고 있다. 네트워크장비가 패치 후 몇시간 동안 정상 작동하는 것을 확인했는데 다음날 장애가 발생했다는 것. 이 기업에 따르면 네트워크장비와 연동되는 인증서버도 네트워크장비와 같은 날 백신 관련 업데이트 작업을 했다. 17일 장애 발생 후 네트워크장비 패치를 원상태로 되돌려도 문제가 이어지다가 서버에서 일정 조치를 한 후 오후 6시께에 인증시스템 문제가 잡혔다는 주장이다. 이는 인증서버가 문제의 원인이었을 가능성을 시사한다.

그런데 복수의 업계 관계자에 따르면 인증서버, 네트워크장비 작업과 별도로, 같은 날 서로 작업 정보가 공유되지 않은 채 지자체 일선에서는 새올시스템 서버 업데이트 작업이 있었다. 새올시스템은 서버가 국가정보자원관리원이 아닌 각 지자체 현장에 있다. 새올시스템 구축·운영은 한국지역정보개발원이 맡고 중소 SI기업 S사가 사업을 수행하고 있다. 지역정보개발원 관계자에 따르면 16일 새올시스템에 일정 부분 변경이 있어서 각 지자체 서버에 대한 업데이트 작업이 이뤄졌다.

◇원인 지목됐던 네트워크장비, 로그 데이터·트래픽 문제없어

한편 17일 장애는 주로 새올시스템에서 불거졌지만 전체 부처에서 문서작성, 결재 등에 쓰는 '온나라 시스템'도 지연되는 등 정부시스템 전반에 문제가 발생했다. 이는 전체 시스템에 영향을 주는 백본망, 네트워크장비, 인증시스템 등이 원인일 가능성을 높인다. 여기에다 인증시스템과 연동되는 네트워크장비에서 전날 패치 작업이 이뤄져 원인으로 지목된 바 있다. 그런데 네트워크장비 장애 시 나타나는 로그 데이터가 관찰되지 않고, 트래픽 부하도 안정적이었다. 백본망도 10기가비트(Gbps)급이라 지연이 발생할 가능성은 없다는 분석이다. 남은 원인은 인증시스템으로 좁혀진다. 여기에다 인증시스템의 문제가 잡힌 상황에도 새올시스템 문제가 이어졌다는 점에서, 인증시스템과 새올시스템 문제가 각각 발생했거나 어느 한쪽에서 발생한 문제가 다른 쪽에 영향을 줘서 양쪽에서 문제가 벌어졌을 가능성이 점쳐진다. 국가정보자원관리원 내에서도 문제의 원인이 어디냐에 따라 책임이 갈리는 만큼 부서별로 입장이 매우 첨예한 것으로 알려졌다.

◇시스템 변경 제각각…문제 발생·대응에 취약

행안부는 17일 오전 8시 40분께 새올시스템 사용자 인증 과정 등에 장애가 발생했고 이후 지자체의 온·오프라인 민원서류 발급이 전면 중단됐다고 설명한 바 있다.

한편 국가정보자원관리원은 정부 전체 IT시스템의 운영·유지관리를 맡는 전담 기관으로, 시스템이 방대하다 보니 복수의 시스템 운영·유지관리 사업자를 선정해 일을 맡긴다. 그 과정에서 수많은 기업이 정보공유 없이 시스템을 관리·변경하다 보니 이로 인한 문제에 취약한 구조다. 대전 센터만 해도 중견 SI기업 S사, D사 등이 시스템별로 운영·유지관리를 나눠서 맡고 있다.

본지 확인 결과, 참여 기업들간 정보공유가 힘든 구조임에도 국가정보자원관리원은 17일 장애 발생 후 사업자들이 서로 장애 상황을 공유하지 않도록 정보를 차단해 초동 대처가 늦어진 것으로 알려졌다.

국가정보자원관리원 상황을 잘 아는 업계 한 관계자는 "정부 통합데이터센터는 시스템을 두고 있는 기관과 사업에 참여하는 기업, 구성 제품이 워낙 복잡하다 보니 어느 한 쪽에서 전체를 파악하기 힘든 상황이다. 이번 사태를 두고도 기관 내부와 기업들이 서로 다른 쪽으로 원인을 돌리고 있다"고 밝혔다.

또다른 관계자는 "국가정보자원관리원이 하는 각종 작업은 내부 조정을 거치지만 개별 시스템을 운영하는 부처나 기관이 수시로 하는 작업은 관리나 조정이 힘든 게 현실"이라면서 "그런 시스템이 다른 시스템에 영향을 미치는 경우 충돌이나 장애로 이어질 가능성을 배제하기 힘들어 보인다"고 말했다.

한편 정부는 장애가 발생한 다음날인 18일 오전 온라인으로 민원서류를 신청·발급받을 수 있는 '정부24' 서비스를 임시 가동했다. 이에 앞서 '지방행정전산서비스 장애 대책본부'를 꾸리고, 대전 국가정보자원관리원에 공무원과 기업 직원 등 100여명을 투입해 복구작업을 시작했다. 다만 아직 '새올' 시스템은 정상화되지 않은 상태로, 웹서비스인 정부24부터 먼저 가동했다. 정부24에서는 행정전산망 마비 사태 이전에 제공했던 민원 서비스 총 1327건이 모두 제공되고 있다. 주민등록등본 등 증명서 발급서비스 887건, 보육·양육수당 신청 등 신청서비스 171건, 전출·전입신고 등 신고서비스 188건, 그밖에 조회서비스 81건 등이다. 안경애기자 naturean@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?