KT 먹통사태는 '인재' 였다.."명령어 누락, 협력업체 직원끼리 작업"

차현아 기자 2021. 10. 29. 15:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(서울=뉴스1) 국회사진취재단 = 구현모 KT 대표가 28일 서울 종로구 KT혜화타워(혜화전화국) 앞에서 지난 25일 발생한 KT의 유·무선 인터넷 장애와 관련해 취재진에 답변하고 있다. 2021.10.28/뉴스1

과학기술정보통신부의 조사결과 지난 25일 KT 유무선 네트워크 먹통사태는 총체적 난국 상황에서 벌어진 인재(人災)였던 것으로 드러났다. 한밤이 아닌 대낮에 KT 협력사가 국가 기간통신망의 핵심 통신장비를 교체한 것은 물론, KT 작업 관리자 한명 없이 협력업체 직원들끼리만 작업한 것이다. 그것도 모자라 네트워크 연결을 끄지 않고 작업하는 바람에 부산에서 발생한 단 한 개의 장비 설정오류가 전국으로 확산했다. 당시 명령어 누락을 사전 점검할 테스트베드는 물론 전국으로 퍼져나가는 오류와 과부하를 막을 시스템도 없었다.

과기정통부는 29일 KT 네트워크 장애 사고와 관련해 정보보호, 네트워크 전문가들로 구성된 사고조사반과 함께 원인을 조사·분석한 결과를 발표했다. 사고조사반은 이번 네트워크 장애사고의 원인을 파악하기 위해 DNS(도메인네임서버)에 발생했던 급격한 트래픽 증가가 디도스(분산서비스거부공격) 이었는지, 네트워크 경로설정(라우팅) 오류가 어떻게 발생했는지 등을 분석했다.
'EXIT' 한 명령어 누락이 불러온 발생한 나비효과
과기정통부의 조사결과 이번 장애는 KT 부산국사에서 기업 내부 네트워크를 연결해주는 장치인 라우터를 교체하던 중 발생했다. 당초 KT 네트워크관제센터는 새벽 1시부터 6시까지 야간작업으로 승인했지만, 협력업체가 이 작업을 낮에 수행하는 과정에서 장애가 발생했다.

심지어 이 작업 현장에는 KT 직원 등 관리자 없이 협력업체 직원만 있었던 것으로 나타났다. 전국 유무선 네트워크에 장애를 발생시킬 수 있을 정도의 중요한 작업과 시설을 KT 직원이 아닌 외부에 오롯이 맡긴 것이다.

(대구=뉴스1) 공정식 기자 = 25일 오전 11시쯤 전국 KT인터넷 장애가 발생해 유·무선망 모두 데이터 전송이 이뤄지지 않는 '먹통' 사태가 발생했다.?이날 정오 무렵 점심 장사를 앞둔 대구의 한 음식점에서 종업원이 작동을 멈춘 포스기를 만져보고 있다. 2021.10.25/뉴스1

장애는 당초 알려진 대로, 협력업체 직원이 라우팅(네트워크 경로설정) 과정 중 프로토콜을 종료하는 'exit' 명령어 입력을 빠뜨린 데서 시작됐다. 하지만 명령어가 누락된 사실은 작성 과정은 물론, 사람이 직접 검토하는 사후 검증에서도 발견하지 못했다.

특히 네트워크가 차단된 상태에서 작성된 명령어에 오류가 없는지 여부를 확인하는 장치인 가상 '테스트베드'는 물론, 지역에서 시작된 오류를 확인한 뒤에도 전국으로 장애 확산을 차단하는 시스템조차 없었던 것으로 드러났다. 네트워크가 연결된 상태에서 교체작업을 진행하다보니, 명령어 오류가 삽시간에 전국 네트워크로 확산된 것이다.
지역단위 오류, 왜 전국으로 확산했나
(서울=뉴스1) 국회사진취재단 = 구현모 KT 대표가 28일 서울 종로구 KT혜화타워(혜화전화국) 앞에서 지난 25일 발생한 KT의 유·무선 인터넷 장애와 관련해 취재진에 답변하고 있다. 2021.10.28/뉴스1
부산 지역 오류가 전국으로 확산된 이유는 KT 네트워크 내 라우터 간 실시간으로 데이터를 주고받는 구조이기 때문이다. PC와 스마트폰, 개인 접속단말 등은 지역에 위치한 라우터를 거쳐 국내외 네트워크로 연결된다. 이용자가 만약 특정 사이트에 접속하려 할 때, 이용자 단말과 해당 사이트의 IP주소 간 경로 정보가 실시간으로 오고가야 한다.

따라서 KT 내부 네트워크에 위치한 라우터끼리는 상호 간 정보를 자동으로 업데이트 한다. 네트워크 차단 없이 진행된 작업으로 발생한 오류가 전국으로 확산된 이유다. 과기정통부 측은 "결국 한 개의 잘못된 라우팅 경로 업데이트가 전국의 라우터에 연쇄적으로 일어나서 장애가 전국적으로 확대된 것"이라고 설명했다.

전국에서 갑자기 인터넷 서비스에 발생한 먹통현상으로 음성전화와 문자서비스가 중단된 것은 물론, 이를 이상히 여겨 단말기를 껐다 켜는 이용자들로 전체 트래픽이 급증했다. 단말기 전원을 리셋하면 단말이 다시 망에 등록되는 구조이므로 트래픽이 추가로 발생하기 때문이다. 이 때문에 전국 네트워크에 과부하가 걸리게 된 것이다.
과기정통부, 네트워크 안정성 확보방안 등 마련
과기정통부는 이번 조사결과를 바탕으로 주요 통신사업자 네트워크 안정성을 담보하는 방안을 마련할 계획이다. 해당 방안에는 단기 대책과 중장기 대책을 포괄하는 방안이 포함될 예정이다.

단기 대책으로는 주요 통신사업자의 네트워크 작업체계, 기술적 오류확산 방지체계 등 관리체계를 점검하고, 주요 통신사업자가 네트워크 작업으로 인한 오류여부를 사전에 진단할 수 있는 시뮬레이션 시스템을 도입하는 방안이 담긴다. 라우팅 설정오류로 인한 피해를 막기 위해 라우팅 작업 한 번당 업데이트되는 경로정보 개수를 일정수준 이하로 제한하는 방안도 검토한다.

중장기적으로는 주요통신사업자의 통신장애 대응 모니터링 체계와 네트워크 안정성과 복원력을 높이는 기술개발, 안정적인 망 구조 등을 갖출 수 있는 방안을 마련한다.

한편 KT도 이용자 피해현황을 조사하고 피해구제 방안을 마련할 계획이다. 방송통신위원회는 이용자 피해구제 방안 이행여부를 점검한다. 방통위는 또 통신장애 발생 시 실효성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안을 검토할 계획이다.

[관련기사]☞ "유명가수 J양에게 성폭행범으로 몰린 채 협박 당하고 있습니다"'구독자 71만' 가세연 "빚 12억, 직원 월급도 밀렸다"…후원 요청'50세 연금 부자' 심권호, 살 쫙 빠진 근황…"가정 꾸리고 싶다"김선호 마스크 광고 부활 왜? "광고 위약금 청구 1건도 없어"유깻잎, 가슴 수술 근황 "괜찮다, 점점 더 말랑말랑해져"
차현아 기자 chacha@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?