①KT 인터넷 먹통은 부산 라우터에서 시작..정부 원인발표

김현아 2021. 10. 29. 15:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과기정통부 KT 네트워크 사고조사반 결과 발표
장애시간은 89분.. 디도스 공격 아냐
작업자 'exit' 명령어 누락
라우팅 오류로 장애 전국 확산
[이데일리 김현아 기자]
10월 25일 발생한 라우터 오류 현상(출처: 과기정통부)
KT 네트워크 구조(출처: 과기정통부)
KT는 코넷망, 프리미엄망, 5G망의 3개의 자율관리네트워크를 보유하고 있다. (코넷망) KT의 인터넷 백본 네트워크. (프리미엄망) IPTV, LTE를 위한 네트워크로 SER(Service edge router)을 통해 프리미엄망으로 연결된다. (5G) 5G 무선망을 위한 백본 네트워크다.

지난 25일 한 낮에 전국적으로 발생한 KT의 유·무선 인터넷 마비 사태는 ‘라우팅 오류의 전국전파’때문으로 공식 확인됐다.

부산 신규기업용 라우터에 잘못된 라우팅 정보가 입력되자, 지역(부산)의 백본 라우터에 잘못된 정보가 전달됐고, 부산의 백본 라우터는 모든 지역 백본 라우터와 연결돼 있는 서울 센터 라우터(혜화센터, 구로센터)에 잘못된 정보를 전달한 것이다. 이후 서울 센터 라우터가 전 지역의 백본 라우터에 잘못된 정보를 전달하면서 라우팅 오류는 전국으로 확대된 것으로 드러났다.

과학기술정보통신부(장관 임혜숙)는 이 같은 내용의 정보보호, 네트워크 전문가들로 구성된 사고조사반(조사반)과 함께 원인을 조사·분석한 결과를 발표했다.

장애 시간은 89분

KT 네트워크 장애사고는 10월 25일 11시 16분경부터 시작돼 도메인네임시스템(DNS) 트래픽 증가에 이어, 네트워크 장애가 발생했고, 12시 45분경 KT의 복구조치가 완료돼 약 89분간 서비스 장애로 이어졌다.

사고조사반은 “지난 10월 25일 11시 16분부터 KT DNS 서버에서 평시보다 트래픽(통화량)이 급증했다”면서 “중앙 1차 DNS(혜화)의 경우 평시 대비 22배 이상, 중앙 2차 DNS(혜화)는 평시 대비 4배 이상, 부산 DNS는 평시 대비 3.7배 이상 증가하는 등 큰 폭의 트래픽 증가가 나타났다”고 밝혔다.

디도스 공격 아냐

하지만 사고조사반은 “패킷분석 결과, 당시 개별 인터넷주소(IP)의 DNS 질의는 최대 15개 이내 수준(중앙 1차 DNS 기준)으로, 다량의 도메인 질의는 없었으며, 네이버, 다음 등 정상적인 도메인 질의 이력만 존재했고, 존재하지 않는 비정상적인 도메인의 반복적인 질의도 없었던 것으로 파악돼 시스템 자원 디도스(DDoS) 공격은 없었던 것으로 분석됐다”고 밝혔다.

또 “네트워크 대역폭 공격과 관련해 트래픽 분석을 실시한 결과, 중앙 1차 DNS서버 대역폭의 최대 8%, 부산 DNS 서버 대역폭의 28% 규모의 트래픽 유입만 있어 대역폭에 비해 충분히 수용 가능한 수준이었다. 네트워크 대역폭 공격은 아닌 것으로 판단한다”고 부연했다.

작업자 ‘exit’ 명령어 누락...라우팅 오류로 장애확산

사고조사반은 로그기록을 분석한 결과, 부산국사에서 기업 망 라우터 교체 작업 중, 작업자가 잘못된 설정 명령을 입력했고, 이후 라우팅 오류로 전국적인 인터넷 네트워크 장애가 발생한 것으로 분석했다.

라우터는 네트워크 경로정보를 구성하기 위해 최신의 경로정보를 라우터끼리 교환(업데이트)하는 프로토콜을 사용하는데, KT 네트워크와 외부 네트워크 경로 구성에는 BGP 프로토콜을 사용하고, KT 내부 네트워크 경로 구성에는 IS-IS 프로토콜을 사용한다. 라우터는 이렇게 BGP, IS-IS 등 프로토콜을 통해 교환한 경로정보를 종합해서 최종 라우팅 경로를 설정하게 된다.

출처: 과기정통부

그런데 작업자의 작업 내역을 확인한 결과, 사고발생 라우터에 라우팅 설정명령어 입력과정에서 IS-IS 프로토콜 명령어를 마무리하는 부분에서 ‘exit’ 명령어를 누락했으며, 이로 인해, BGP 프로토콜에서 교환해야 할 경로정보가 IS-IS 프로토콜로 전송됐다.

통상 1만개 내외의 정보를 교환하는 IS-IS 프로토콜에 수십만 개의 BGP 프로토콜의 정보가 잘못 전송되면서, 라우팅 경로에 오류가 발생하게 된 것이다.

이러한 라우팅 경로에 발생한 오류는 다음과 같은 경로로 전국적으로 확산됐다.

IS-IS 프로토콜 내의 라우터들은 상호간의 정보 최신화를 위해 자동으로 데이터를 주고받는데, 부산 지역라우터에 잘못된 라우팅 경로가 설정된 이후, 다른 지역의 IS-IS 라우터 등에도 잘못된 업데이트 정보가 전달됐다.

KT 네트워크 내에 있는 라우터들을 연결하는 IS-IS 프로토콜은 잘못된 데이터 전달에 대한 안전장치 없이 전국을 모두 하나로 연결하고 있고, 결국 한 개 라우터의 잘못된 라우팅 경로 업데이트가 전국의 라우터에 연쇄적으로 일어나서 장애가 전국적으로 확대됐다.

김현아 (chaos@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?