어떻게 해야 데이터센터의 정전을 막을까 [테크토크]

임주형 2024. 11. 8. 15:24
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

데이터센터의 생명줄, 예비 발전 시설
UPS와 백업 발전기로 전력 공급 구성
완벽에 완벽 기해도 100%는 불가능

서버 용어 중에는 '업타임(Uptime)'이라는 단어가 있습니다. 서버용 컴퓨터가 재부팅된 후 지금까지 얼마 동안 꺼지지 않고 운영됐는지 백분율로 표기한 수치입니다. 예를 들어 업타임이 100%인 데이터센터는 전원이 올라간 후 지금까지 단 1초도 꺼지지 않았다는 뜻입니다.

업타임 100%는 데이터센터의 생명과 같습니다. 만일 데이터센터가 단 0.02초만 가동을 중단해도 시스템 전체가 무너져 버립니다. 즉, 무슨 일이 있더라도 데이터센터는 반드시 24시간 내내 돌아가야 한다는 겁니다. 전력 공급이 데이터센터의 최우선순위로 꼽힐 수밖에 없는 이유입니다.

발전소 한 대 전력 잡아먹는 데이터센터

카카오 데이터센터. 사진은 기사 중 특정 표현과 관련 없음 [이미지출처=연합뉴스]

하지만 데이터센터는 적게는 수백, 많게는 수만대의 컴퓨팅 장치와 전선이 설치된 복잡한 구조물입니다. 한 번에 100~200메가와트(MW)의 전력을 잡아먹지요. 거의 대형 발전소 한 개에 준하는 전력인 만큼, 데이터센터에 '무슨 일이 벌어지더라도 반드시' 전력을 공급하는 건 거의 불가능에 가까워 보입니다.

따라서 모든 데이터센터는 건물 내에 '예비 전력 시설'을 설치합니다. 심지어 한 개도 아니고, 두 개나 설치합니다. 사실상 이 예비 시설이야말로 데이터센터의 귀중한 생명줄이나 다름없습니다. 데이터센터의 예비 전력 시스템은 크게 '무정전시스템(UPS)'와 '백업 발전기'로 구분됩니다.

데이터센터의 생명줄, 예비 발전 시설

데이터센터 내 UPS 배터리 시스템을 유지보수하는 엔지니어. UPS는 정전이 발생했을 경우 즉각 작동해 서버를 살리는 긴급 수단이다. [이미지출처=유튜브 캡처]

UPS, 백업 발전기 둘 다 바깥에서 전력을 끌어올 수 없을 때 작동하는 예비 시스템입니다. 보통 데이터센터는 한 번에 100MW 이상의 전력을 잡아먹으니, 당연히 근처 발전소 전력을 가져오는 게 이상적입니다.

하지만 이런 시스템이 365일 24시간 내내 '100%' 가동된다는 보장은 없지요. 발전소나 송전 시설, 혹은 변압기에 약간만 문제가 생겨도 언제든 전력 공급이 끊길 수 있으니까요. 그럴 때마다 데이터센터 내 스위치가 전환되면서, 즉각 예비 전력 시스템을 가동하는 겁니다.

UPS와 백업 발전기 둘 다 예비 전력을 공급한다는 점에선 동일하지만, 세세한 역할은 좀 다릅니다. 우선, UPS는 정전이 일어나자마자 즉각 서버 컴퓨터에 전력을 공급합니다. 하지만 UPS엔 한계가 있습니다. 일반적으로 UPS는 이차전지(배터리)에 보관한 예비 전력을 컴퓨터에 배분하는 역할이기 때문이지요. 갑자기 전력이 차단된 컴퓨터를 최대한 살려 놓기 위한 일종의 '긴급 보호 장치'에 더 가깝습니다.

한편 UPS가 서버에 긴급 조처를 하는 사이, 데이터센터와 연결된 또 다른 공간 어딘가에선 열심히 '백업 발전기'가 돌아갑니다. 이런 백업 발전기는 디젤, 가스 발전기나 전기 모터 등으로 이뤄집니다. 대형 장비인 만큼 발전소 하나에 준하는 전력을 만들 수 있지만, 대신 가동률 100%에 이를 때까지 '예열 시간'이 필요합니다. UPS는 발전기가 완전히 제 기능을 할 때까지 시간을 벌어주는 시스템인 셈이지요.

100% 완벽할 순 없다

데이터센터는 정전을 대비해 대형 가스터빈, 디젤 발전기를 구비한다. 사진은 미국 '캐터필러'의 데이터센터용 발전기. [이미지출처=캐터필러]

데이터센터는 이중 예비 시설로 전력 공급을 보장받지만, 여전히 업타임 100%를 완전히 성취하는 건 매우 힘든 일입니다. 예를 들어 2022년 10월 한국 최대의 메신저 시스템인 '카카오톡'이 데이터센터 화재로 먹통이 된 바 있지요. 당시 카카오가 대여했던 데이터센터 시설에도 UPS와 백업 발전기가 있었습니다. 하지만 화재는 UPS와 연결된 배터리에서 벌어졌고, 결국 예비 시스템 자체가 셧다운되면서 서버 정지를 막을 수 없었습니다.

결국 절대적으로 완벽한 시스템은 없습니다. 단지 데이터센터를 시공하고 관리하는 IT 기업들은 철저한 이중, 삼중의 보호 장치를 통해 만일의 사태를 대비할 뿐입니다. 모든 전력 배송 장치에 열 센서와 화재 방지 장치를 설치하거나, 화재에 취약한 배터리에 특수한 화재 대응 시스템을 설치하거나, 심지어 UPS나 백업 발전기를 중복으로 설치하기도 합니다.

한 대의 데이터센터를 설치하는 데 천문학적인 비용이 듭니다. 이 비용은 비단 고성능 CPU나 GPU뿐만 아니라, 이런 순수한 '엔지니어링 난이도'에 드는 비용이기도 합니다. 오늘날 IT 기업들은 더욱 안전한 데이터센터를 만들기 위해 UPS, 발전기, 소방 시설, 모니터링 시스템을 포함한 수많은 보호 체계에 투자합니다.

이 때문에 데이터센터 건설 비용은 조 단위 이상으로 치솟지만, 예기치 못한 서버 다운으로 야기될 잠재적 매출·브랜드 가치 손실과 비교하면 여전히 감당할 만한 투자입니다.

임주형 기자 skepped@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?