'EXIT' 이 명령어 하나 누락이 KT 전국망 셧다운 시켰다

박건형 기자 2021. 10. 29. 15:37
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KT, 협력업체에 작업 맡기고 현장 감독도 안해
지난 10월 25일 오전 한때 KT의 '설정 오류에 따른 장애'로 유·무선 인터넷 서비스가 중단됐다. 네트워크 접속 장애는 1시간가량 만에 복구됐지만, 서비스 중단이 점심시간과 겹치면서 전국 곳곳에서 피해사례가 잇따랐다. 사진 서울 종로구 KT 광화문 사옥 입구/연합뉴스

지난 25일 전국을 마비시킨 KT의 유무선 인터넷 마비 사태는 부산 지사 현장 작업자의 한 단어짜리 명령어 누락이 원인인 것으로 밝혀졌다.

과학기술정보통신부는 29일 이번 사고와 관련해 정보보호·네트워크 전문가로 구성된 사고조사반과 함께 조사한 사고 발생 경위를 발표했다. 조사 결과 이번 사고는 25일 오전 11시16분쯤 시작돼 낮 12시45분 복구가 완료될 때까지 약 89분간 이어졌다.

홍진배 과학기술정보통신부 정보보호네트워크정책관이 2021년 10월 29일 정부서울청사 브리핑실에서 25일 발생한 KT 네트워크 장애 원인분석 결과를 발표하고 있다./연합뉴스

사고조사반이 관련 로그 기록을 분석한 결과, KT 부산지사에서 네트워크 트래픽 경로를 설정하는 ‘기업 망 라우터’ 교체 작업 중에 작업자가 잘못된 명령어를 입력했고 이후 잘못된 설정이 전국으로 퍼지면서 인터넷망이 마비됐다.

작업자는 사고 발생 라우터에 명령어를 입력하면서 ‘exit’라는 단어 하나를 누락했다. 그 결과 외부와 트래픽 설정을 교환하는데 쓰이는 정보(BGP)까지 KT 내부망(IS-IS)에 일제히 몰리면서 오류가 발생한 것으로 나타났다. IS-IS 경로는 통상 1만건 내외의 정보를 한번에 업데이트 하는데 수십만배 규모인 BGP 정보가 전송되면서 문제가 생겼다는 것이다. 특히 부산에서 잘못 설정된 정보는 서울 혜화센터와 구로센터를 거쳐 전국으로 순식간에 확산됐다. 작업자가 명령어를 입력한 뒤 전체 인터넷망이 먹통이 되는데까지 걸린 시간은 30초에 불과했다.

조사반은 이 과정에서 KT와 협력업체의 업무 처리에 심각한 문제가 있었다는 점도 확인했다. 당초 새벽 1~6시에 하는 야간작업으로 승인된 장비 설치 작업을 인터넷 사용이 많은 월요일 점심 시간대에 진행했고, KT 직원들은 현장에 있지도 않았다. 또 잘못된 설정이 전국망으로 퍼져가는 것을 차단할 별도의 안전장치도 마련돼 있지 않았던 것으로 나타났다.

과기정통부는 “주요 통신사업자와 함께 네트워크 안정성 확보방안을 마련할 계획”이라며 “오류를 사전에 진단할 수 있는 시뮬레이션 시스템도 도입하도록 할 방침”이라고 밝혔다. 방송통신위원회는 KT의 이용자 피해구제 방안 이행 여부를 점검하는 한편, 통신장애가 발생할 경우 실효성 있는 피해구제가 가능하도록 법령 및 이용약관 등 개선방안 마련에 나서기로 했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?