"판교IDC, 배터리 모니터링 작동안해"…카카오에도 다중화 지시

김승한 기자 2022. 12. 6. 14:04
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과기정통부, 사고 재발 방시 개선 조치 요청SK C&C, 다양한 화재감지 시스템 구축해야카카오, IDC 간 높은 수준의 다중화 적용네이버, 철저한 장애 예방·신속 복구 요구
경찰과 소방,국과수,전기안전공사 등 관계자들이 10월17일 오전 경기도 성남시 분당구 판교 SK C&C 데이터센터 화재 현장에서 합동감식을 위해 이동하고 있다. /사진=뉴시스


정부가 판교 IDC(데이터센터) 화재로 발생한 '카카오 먹통' 사태와 관련해 SK C&C의 IDC 내 배터리와 전기설비 간 공간을 분리할 것을 지시했다. 카카오와 NAVER(네이버)에는 IDC 간 매우 높은 수준의 다중화를 적용하고, 장애 시나리오별 복구 방안 등을 재점검해 개선방안을 마련하도록 했다.

6일 과학기술정보통신부는 방송통신위원회, 소방청과 SK C&C 판교 IDC 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 개선조치 및 조사결과를 발표했다. 과기정통부는 3사에게 사고 재발 방지를 위한 개선 조치를 요구하고, 이행 결과 및 향후 계획을 한 달내 보고하도록 했다.

우선 SK C&C에는 현재 BMS(배터리 모니터링 시스템) 외 다양한 화재감지 시스템 구축 방안을 수립하도록 했다. 조사결과 SK C&C의 IDC에는 BMS를 갖추고 있지만 화재 당시 이상징후가 나타나지 않았기 때문이다. 과기정통부는 "BMS에서 화재 징후가 없던 상황에서, 지하3층 배터리실에서 발화가 시작된 것으로 파악돼 이 같은 조치를 내렸다"고 설명했다.

더불어 배터리와 다른 전기설비 간 물리적 공간을 분리하고 배터리실 내 전력선을 재배치하도록 했다. 리튬이온 배터리가 일부 UPS(무정전 전원 장치)와 완벽히 분리되지 않은 공간에 배치돼 화재 열기로 UPS가 작동이 멈추면서 일부 전원공급도 중단됐다는 이유에서다.

리튬이온 배터리 화재 시 필요한 소화설비 구축 또는 불가능할 경우 대안 마련도 요구했다. 화재 때 가스 소화 장비가 작동했지만, 가스 소화가 어려운 리튬이온 배터리 화재 특성상 초기 진압에 한계가 있었기 때문이다.

SK C&C 판교 데이터센터 화재 전개 과정. /사진=과기정통부


카카오에는 카카오 서비스 장애 복구 지연의 핵심 원인인 '운영 및 관리도구'를 IDC 간 매우 높은 수준의 다중화를 적용하도록 했다. 사고 당시 판교 IDC만 카카오의 운영 및 관리도구가 이중화됐을 뿐 다른 IDC에는 그러지 않았다는 점을 지적한 것이다. 이에 따라 복구에도 상당 시간이 소요됐다는 과기정통부의 설명이다.

또 카카오인증, 카카오톡 등 '핵심기능'에 대해서는 우선순위, 중요도 등을 고려해 지금보다 높은 수준의 분산 및 다중화를 적용하는 방안 수립하도록 했다. 과기정통부는 "카카오의 대부분 핵심기능은 판교 IDC에 집중돼 있어 사고 당시 즉각 영향을 받았다"며 "특히 여러 서비스의 구동 초기단계부터 필요한 카카오인증도 판교 IDC에 집중돼 여러 서비스에 광범위한 영향을 미쳤다"고 말했다.

이와 함께 과기정통부는 카카오에 서비스 장애 발생 시 신속하게 이용자에게 고지할 수 있는 체계를 구축하고, 이번 사태로 국민 피해를 구제하기 위한 원칙과 보상 계획을 수립하도록 요구했다.

마지막으로 네이버에겐 지금보다 철저한 장애 예방과 신속 복구를 위한 서비스별 복구 목표, 장애 시나리오별 복구 방안 등을 재점검해 개선방안을 마련하도록 했다. 과기정통부는 "네이버는 IDC 간 이중화 조치를 해 서비스 중단은 없었으나, 타 IDC로 서비스 전환 과정에서 파파고, 뉴스 등 일부 기능에 오류가 발생했다"며 "상대적으로 낮은 복구 우선순위, 복구하는 데이터의 무결성 확인 등의 이유로 복구에 시간이 소요됐다"고 했다.

아울러 과기정통부는 3사에게 재난대응 시나리오 개발 및 세부 훈련 계획 수립 후 모의 훈련을 실시해 결과를 보고하도록 했다.

과기정통부는 1개월 후 3사가 제출한 조치결과 및 향후 계획을 토대로 '재난 예방-대비-대응-복구' 전 단계별 재난관리체계를 마련한다. 종합 개선방안 발표는 내년 1분기를 목표로 하고 있다.

이종호 과기정통부 장관은 "이번 사고가 국민 일상의 불편을 넘어 경제·사회 전반을 마비시키는 등 지대한 영향을 끼치는 것을 알게 됐다"며 "주요 디지털서비스에 대한 재난대응체계를 원점에서 재검토하고 각 사업자별 개선방안, 점검결과, 제도개선 등을 종합해 디지털 시대에 맞는 안정성 강화방안을 마련하겠다"라고 말했다.

김승한 기자 winone@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>

Copyright © 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?