89분 KT 통신장애..관리체계 부실 '도마'(종합)

차민영 2021. 10. 29. 19:36
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과기정통부, KT 통신장애 관련
29일 긴급브리핑 개최
시설관리 협력사 외주에 감독도 부실
홈페이지로만 알린 점도 문제
이용자 피해 대책 마련
전문가 "北등 외부에 취약점 드러낸 것"
과학기술정보통신부가 29일 오후 3시 정부서울청사에서 열린 KT 유·무선 통신장애 관련 긴급 브리핑에서 KT 네트워크 장애 사고 관련 원인 조사·분석 결과와 재발 방지 대책 등을 발표했다. 사진은 조경식 과기정통부 제2차관

[아시아경제 차민영 기자, 구은모 기자] "KT가 통신회사인 만큼 전문성이 있을 것이라고 기대했는데 신사업에 정신이 팔려 근본을 잊은 것 같다. 해킹도 아닌 관리 실패로 인해 생긴 일이라면 황당한 일이다."

국내 유선통신 1위 사업자인 KT의 전국 유·무선 인터넷 장애 사태가 '인재(人災)'인 것으로 밝혀지면서 업계 안팎에서 비판이 쏟아졌다. 주무부처인 과학기술정보통신부조차 네트워크 설비 작업 과정의 'ABC' 단계에 해당하는 아주 기초적인 규정조차 무시됐다며 황당하다는 반응이다.

왜 점심시간 직전에? "주간 작업 선호"

과학기술정보통신부 29일 오후 3시 정부서울청사에서 조경식 제2차관 주재로 열린 긴급 브리핑에서 이 같은 내용을 포함한 KT 네트워크 장애 사고 관련 조사·분석 결과를 발표했다.

KT 네트워크 장애사고는 지난 25일 오전 11시 16분경부터 시작됐다. KT 부산국사에서 기업 망 라우터 교체 작업 중 작업자가 잘못된 설정 명령을 입력했고 이후 라우팅 오류로 인해 전국적인 인터넷 네트워크 장애가 발생했다. DNS 트래픽 증가에 이어 네트워크 장애가 발생했고 이어 12시 45분경 KT의 복구조치가 완료돼 약 89분간 서비스 장애가 발생했다.

구체적인 타임라인은 ▲11시16분 트래픽 급증 ▲11시20분 KT에서 인터넷 장애 인지 ▲11시20분대 디도스 가능성 의심 ▲11시 40분 과기정통부에 신고 ▲11시44분 KT 디도스 공격이 아닌 라우팅 오류로 정정 알림 ▲11시56분 과기정통부 2단계 경보 발령 ▲11시57분 복구 진행 시작 ▲12시45분 복구 완료 순이다.

KT 관리상 문제점도 조사 과정에서 적나라하게 드러났다. KT 네트워크관제센터는 10월 26일 새벽 1~6시 야간작업을 승인했으나 KT 감독자와 협력업체 직원들은 협의 하에 25일 낮 점심시간 직전에 작업을 수행했다. 협력업체 직원인 작업자들은 작업 관리자가 다른 업무로 자리를 비운 사이 라우팅 작업을 수행했다. 네트워크가 연결된 채로 작업이 이뤄지면서 실시간으로 네트워크망 장애가 발생하게 됐다. 홍진배 과기정통부 정보보호네트워크정책관은 "본인과 당사자, 관리자에게 직접 확인한 결과 주간작업을 선호했던 것으로 파악했다"고 했다.

기술적 문제도 지적됐다. 원청인 KT는 사전검증 단계에서 오류를 파악하지 못했다. 라우팅 작업계획서상의 라우팅 설정 명령어 스크립트에서 IS-IS 프로토콜을 종료하는 exit 명령어가 누락됐지만, 스크립트 작성 과정과 사전 검증 과정에서 이를 걸러내지 못했다. 1,2차에 걸친 사전검증 단계가 존재했으나 사람이 직접 검토하는 체계로 오류를 발견하지 못했다.

조사를 진행한 정부조차 당황스럽다는 반응이다. 사고 현장에서는 '네트워크를 작업할 땐 1~2시간 테스트 후 오픈한다' 같은 기본적인 작업 수칙조차 지켜지지 않았다. 허성욱 과기정통부 네트워크정책실장은 "'파란불에 신호등을 건너야 한다'는 상식을 어겨 사고가 난 것과 같다"며 "이를 법으로 일일이 정해 규제할 대상인지 논의 중"이라고 말했다.

다만 인터넷망이 아닌 IPTV 서비스망과 음성전화?문자 서비스망은 인터넷 서비스 망과 별도로 구성돼 있으나 트래픽 가중에 영향을 받은 것으로 조사됐다. 단말전원을 리셋한 이용자로 인한 트래픽 증가가 발생해 부하가 가중된 것으로 추정됐다.

KT, 이용자 피해보상 마련

과기정통부는 KT와 협력해 이용자 피해 보상 방안도 마련한다. KT는 이용자 피해현황 조사 및 피해구제 방안 마련을 추진하고, 방송통신위원회는 이용자 피해구제 방안 이행여부를 점검한다. 방통위는 통신장애 발생시 실효성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안 마련을 검토할 계획이다.

다른 통신사들에 대한 점검도 병행한다. 홍진배 정보보호네트워크정책관은 "사고 발생 첫날 즉시 주요 통신사업자들인 인터넷서비스제공업체(ISP)들에게 긴급점검을 요구했다"며 "네트워크 안정성대책을 하면서 이 사업자들은 어떤 작업 관리지침을 가지고 있고 어떤 식으로 시뮬레이션이 되는지, 시뮬레이터 운영 여부, 구조 등도 같이 파악하고 개선점을 찾아갈 계획"이라고 전했다.

KT가 29일 이사회를 열고 전국 유·무선 통신망 장애 사고의 후속조치로 초고속인터넷 서비스 기준 ‘연속 3시간 이상 서비스 불통’ 피해보상 약관을 개정하는 방안을 논의했다. 구현모 KT 대표가 지난 28일 고개 숙여 사과하고 있다.

KT는 현재 구체적인 보상방안과 재발 방지 대책을 마련 중이다. KT는 29일 보도자료를 내고 "일반적으로 KT 네트워크 장비와 관련된 작업은 야간에 진행하는 것이 원칙이며 작업계획서를 제출, 승인한 이후 KT 직원의 입회 하에 진행된다"며 "이번 장애의 경우 야간작업으로 승인을 받았음에도 이를 위반해 주간에 작업이 이뤄졌으며 KT 직원도 이를 양해하고 관리 감독을 소홀히 했다. 일탈이 이뤄진 예외적인 사례로 재발되지 않도록 프로세스를 강화하겠다"고 밝혔다. 이와 함께 기존 센터망과 중계망에만 적용됐던 라우팅 오류 확산 방지 기능을 엣지망까지 확대 적용하고 현재 우면동 센터에서만 운영되던 테스트베드도 전국 단위로 확대 운영한다.

"야단만 치고 끝낼 일 아냐"

전문가들은 다시는 반복되서는 안 될 인재라는 평가다. 임종인 고려대 정보보호대학원 교수는 "야단만 치고 보상만 하고 끝날 것이 아니다"라며 "북한이든 중국이든 한국을 무너뜨리는 것 어렵지 않다는 것을 보여준 사례다. 통신망이 무너지면 군사망부터 금융망, 의료망까지 모든 일상이 망가지고 국가 안보도 위험해진다"고 짚었다.

통신업계에서 외주를 주느냐 여부는 사업부문, 개인 성향 등에 따라 천차만별이다. 통신장비업계 관계자는 "라우팅 작업이든 어떤 개발 작업이든 테스트를 먼저 하고 에러를 잡은 후 실적용하는 것은 기본 중의 기본"이라며 "통신사가 협력사에 외주를 줄 수는 있지만 원청의 철저한 관리 감독이 수반돼야 한다"고 말했다.

재발 방지를 위한 관리 시스템상의 허점을 보완해야 한다는 목소리도 나왔다. '사이버 복원력(Cyber Resilience)'이 신속히 가동되도록 정밀한 위험관리시스템을 구축해야 한다는 지적이다. 사이버 복원력은 조직 안팎의 예측 불가능한 위협이나 부정적 영향에 대응하는 보안전략을 수립하고 리스크 해소 역량을 갖추는 것을 말한다.

임종인 교수는 "자문위원회는 권한이 없어 소용 없기 때문에 감사위원회도 제대로 작동하게 해야 한다"며 "감사위가 회계감사만 할 게 아니라 컴플라이언스가 제대로 되는지 주기적으로 점검하도록 전문성을 가진 감사위가 가동하도록 해야 한다"고 지적했다.

차민영 기자 blooming@asiae.co.kr

구은모 기자 gooeunmo@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?