판교 악몽은 그만… 카카오 데이터센터 안산 ‘안전성’ 자신
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
"10·15 사태라고 부르는 SK 판교 데이터센터 화재 사건은 트라우마와 같은 뼈아픈 경험이었습니다."
카카오 데이터센터 안산은 연면적 4만7378㎡의 하이퍼스케일(10만대 이상의 서버를 운영할 수 있는 초대형 데이터센터) 규모를 자랑한다.
카카오 데이터센터 안산 설계는 안전성에 방점이 찍혀 있다.
2022년 10월 SK C&C 판교 데이터센터 화재 시 주요 장비 일부가 재해복구센터에 이중화돼 있지 않아 복구에 애를 먹은 경험이 있는 탓이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
주요 장비 이중화·화재 진화 중점
“10·15 사태라고 부르는 SK 판교 데이터센터 화재 사건은 트라우마와 같은 뼈아픈 경험이었습니다.”
정신아(사진) 카카오 대표가 지난 3월 취임 후 취재진에 처음 모습을 드러내면서 밝힌 첫 마디다. 정 대표는 지난 11일 첫 자체 데이터센터를 공개하면서 “이런 일이 반복되지 않도록 철저하게 원인을 분석하고 규명해 데이터센터 설계에도 반영했다”고 자신감을 내비쳤다.
카카오는 이날 경기도 안산시 한양대 에리카캠퍼스 내 위치한 ‘카카오 데이터센터 안산’에서 프레스 밋업 행사를 개최했다. 카카오는 지난해 9월 최초의 자체 데이터센터를 준공해 올해 1월 가동을 시작했다.
카카오 데이터센터 안산은 연면적 4만7378㎡의 하이퍼스케일(10만대 이상의 서버를 운영할 수 있는 초대형 데이터센터) 규모를 자랑한다. 4000개의 랙, 12만대의 서버를 보관할 수 있다. 이를 통해 6EB(엑사바이트)의 데이터를 저장할 수 있다.
카카오 데이터센터 안산 설계는 안전성에 방점이 찍혀 있다. 2022년 10월 SK C&C 판교 데이터센터 화재 시 주요 장비 일부가 재해복구센터에 이중화돼 있지 않아 복구에 애를 먹은 경험이 있는 탓이다. 당시 화재로 카카오톡을 비롯한 주요 서비스가 127시간가량 장애를 겪었다. 정 대표는 “국내 어떤 기업보다도 데이터 안정성을 최고의 수준으로 끌어올려야 한다는 실제 경험에 기반한 사명감으로 부족한 부분을 원점부터 재검토했다”며 “완공하는 날까지 설계와 시스템을 끊임없이 보완하고 고민했다”고 강조했다.
안전성의 핵심은 이중화다. 전력회사로부터의 전기를 공급받는 전력망뿐 아니라 서버에 전기를 최종적으로 공급하기까지의 전 과정, 통신사에서 서버까지 통신을 제공하는 과정, 냉동기부터 서버실까지의 냉수 공급망 등 운영 설비를 이중화했다. 데이터와 운영 도구 등도 다중화했다. 일부 시스템에 문제가 발생하더라도 이용자가 체감하는 불편을 최소화하고 복구 시간을 최대한 단축하기 위해서다.
특히 화재 조기 진화를 위한 대응 시스템 구축에 중점을 뒀다. 데이터센터 화재 당시엔 배터리 온도 등을 모니터링하는 시스템(BMS)이 제대로 작동하지 않아 화재 감지가 이뤄지지 않으면서 배터리실에서 발화가 시작됐다. 데이터센터 안산은 무정전전원장치(UPS)실과 배터리실을 방화 격벽으로 분리 시공하고 모든 전기 판넬에 온도 감지 센서를 설치해 이상 온도 상승 시 즉각 대응하도록 설계했다. 특히 화재 진압이 어려운 리튬이온배터리 화재에 대비해 화재 대응 시스템을 자체 개발해 적용했다. 이 시스템은 특허 출원까지 마쳤다.
카카오는 인공지능(AI) 위주로 재편되는 산업 트렌드에 맞춰 전용 데이터센터를 추가 건립할 계획이다. 먼저 AI 데이터센터의 최첨단 설비 중 하나로 거론되는 엔비디아의 그래픽처리장치(GPU) H100 등 AI 기술 구동을 위한 칩을 데이터센터 안산에 들여올 방침이다. AI 전용 제2 데이터센터 건립 부지도 살펴보고 있다.
안산=임송수 기자 songsta@kmib.co.kr
GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재 및 수집, 재배포 및 AI학습 이용 금지
Copyright © 국민일보. 무단전재 및 재배포 금지.