'쌍둥이 데이터센터' 있었다면…초유의 카톡 먹통 막았다 [Digital+]

나현준 2022. 10. 31. 17:09
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

"구글은 주 데이터센터와 완전히 똑같은 건물을 원격지에 짓고 곧바로 작동할 수 있도록 하는 '미러 사이트' 수준의 재해복구(DR)센터가 전 세계에 23개나 있다."(박성중 국민의힘 의원)

10월 24일 국회 과학기술정보방송통신위원회 국정감사에서 카카오 서비스 먹통 사태를 둘러싸고 가장 많이 회자된 단어는 바로 'DR센터'였다.

DR(재해복구·Disaster Recovery)센터란 수많은 서버가 운용되는 메인 인터넷데이터센터(IDC)에 화재, 지진, 전쟁 등 재난 상황이 생겼을 때 핵심 데이터를 실시간으로 동기화해 보호하는 일종의 '쌍둥이 데이터센터'를 가리킨다. IDC와 물리적으로 떨어진 곳에 설치된다.

2001년 9·11테러를 계기로 재난재해 시 데이터 보관이 중요해지면서 금융권을 중심으로 DR센터 도입이 의무화됐다. 다만 금융권과 동일하게 막대한 고객 정보를 다루는 정보기술(IT) 플랫폼에선 DR센터가 의무화돼 있지 않다.

카카오는 이번 '먹통 사태'에 따른 서비스 장애 기간을 127시간30분으로 공식화했다. 서비스 장애 발생 이틀째인 10월 16일 대표 서비스인 카카오톡 기능 일부를 복구하면서 순차적으로 서비스 정상화를 진행했지만, 모든 서비스가 완전 복구되는 데는 만으로 닷새 이상 걸린 셈이다. 장애 복구에 이처럼 오랜 시간이 걸렸던 근본적인 이유로 부실한 DR 체계가 지목되면서, 이번 국정감사 때도 관련 논의와 질타가 이어졌다. 매일경제는 카카오 서비스 먹통 사태를 계기로 중요성이 부각된 DR센터를 중심으로 데이터센터의 안정성 확보를 위한 다양한 대안 조치를 심층 조명한다.

◆ 계란 한 바구니에 담으면 대재앙
우리가 인터넷 공간에서 활동하는 모든 기록은 데이터센터 서버에 저장된다. 문제는 원 서버가 이번과 같이 화재 등 재난으로 인해 소실될 수 있다는 것이다. 이를 방지하기 위해 금융권, IT 기업 등 고객 정보가 많은 기업들은 원 서버를 '백업'(다른 곳에 저장)하는 서버를 둔다. 여기서 장소 개념으로 이중화와 이원화가 등장한다. 이중화란 '같은 데이터센터'에서 원 서버의 내용을 복사해 두는 개념이다. 사람들에게 널리 알려진 백업, 그리고 업계 전문가들이 강조하는 서버 이중화(HA·High Availability)가 대표적인 이중화 기법이다.

백업은 여러 서버의 내용을 1개 백업 서버에 저장하는 반면, HA는 1개 서버의 내용을 1개 백업 서버에 저장한다. 원 서버 훼손 시 백업 서버는 복구에 1~2시간이 걸리는 데 반해 HA는 서버를 1대1로 복사했기 때문에 5분 이내로 복구가 가능하다. 다만 1개 서버당 구축 비용을 보면 백업이 150만원인 데 반해 HA는 1400만원에 달한다. HA가 백업에 비해 서버 구축 비용이 더 많이 들고, HA 솔루션을 도입해야 하는 등 별도의 소프트웨어 비용이 들기 때문이다. 그래서 같은 데이터센터 내에서도 중요한 정보는 HA를, 그렇지 않은 정보는 백업을 하는 경우가 많다.

이중화보다 한 단계 더 나아간 개념이 바로 이원화다. 이중화는 서버 내용을 복사할 순 있지만 같은 데이터센터 내에서 작업이 이뤄진다는 한계가 있다. 이번 SK C&C 데이터센터 화재와 같이 데이터센터 전체에 전원 공급이 차단되면 속수무책으로 당할 수밖에 없다. 그래서 원 서버가 있는 데이터센터에서 15㎞ 이상 떨어진 곳에 별도의 백업 데이터센터를 짓는 '이원화' 개념이 탄생한 것이다. DR센터가 바로 이원화의 대표적인 방식이다. 박 의원의 지적대로 글로벌 빅테크들은 1개사당 수조 원을 매년 투여하며 DR센터 시스템을 구축하고 있다. 구글 데이터센터에 화재가 수차례 발생했지만 구글 서비스가 마비되지 않았던 이유다.

DR센터도 기본적으로 HA와 비슷하게 1대1로 서버를 복사하는 개념이다. 복구 시간·범위 정도에 따라 미러 사이트-핫 사이트-웜 사이트-쿨 사이트 등 4가지로 종류가 나뉜다. 미러 사이트로 갈수록 데이터 및 시스템 복구가 가장 빠르다.

◆ '대세' 클라우드로 DR 도입 가능할까

카카오는 이번 카카오톡 먹통 사태와 관련해 연일 "(같은 장소에서 하는) 이중화 조치는 그동안 잘해 뒀었다"며 억울함을 표시해 왔다. 하지만 앞에서 언급한 것처럼 카카오는 다른 장소에 데이터를 백업해 두는 이원화에 미흡했고, 결국 서비스 장애가 장시간 발생했다.

이원화의 대표 방식인 DR센터는 데이터 복구를 위한 가장 확실한 방법이다. 다만 HA와 비슷한 솔루션 비용에 더해 데이터센터 건립 비용, 원 데이터센터와 DR센터 사이의 네트워크 비용 그리고 데이터센터를 가동하기 위한 엄청난 전기 비용이 든다. 이를테면 카카오의 두 번째 데이터센터(경기도 시흥에 2026년 완공 예정) 전력량이 서울 롯데월드타워 전력 사용량의 5배에 달할 수 있다는 전망이다.

이처럼 막대한 비용 부담으로 인해 별도 DR센터를 도입해 감당할 수 있는 여력이 있는 플랫폼 기업은 네이버와 카카오 등 극히 일부에 불과하다는 염려가 나온다. 이 때문에 DR 솔루션을 확대하려면 물리적으로 직접 데이터센터를 구축하지 않고, 클라우드 업체의 DR 솔루션을 활용하는 게 실용적이라는 주장도 나오고 있다.

해외 클라우드 서비스를 국내에 공급하는 A업체 관계자는 "클라우드는 한 곳의 데이터센터에 문제가 생기면 다른 가용 영역의 데이터센터로 자동 전환돼 안정적이고 효율적"이라며 "클라우드 공급사(CSP)들은 지속적인 투자로 최신 기술이 적용된 전문적인 재해복구 솔루션(DRaaS)를 갖추고 있다"고 귀띔했다.

글로벌 OTT(온라인동영상서비스) 기업인 넷플릭스가 DR 기능이 탑재된 아마존 AWS 클라우드 서비스를 사용하는 것이 대표적인 예다. 박윤규 과학기술정보통신부 2차관도 10월 21일 구글, 아마존 등 외산 클라우드 업체 고위 임원과의 미팅 자리에서 "해외 빅테크들의 장애 예방·복구에 대한 선진적 대응 노하우를 공유해주길 바란다"고 강조한 바 있다.

하지만 일각에선 클라우드 기반이 실효성이 없을 것이란 지적도 나온다. 우선 해외 업체들의 솔루션에 종속될 가능성이 크다는 경고다. 아마존·마이크로소프트(MS)·구글 등 빅3의 클라우드 시장 점유율은 지난 1분기 기준 65%에 달한다.

10년 넘게 해외 DR 솔루션을 국내에 도입하는 역할을 하고 있는 B업체 관계자는 "클라우드 업체 입장에서 DR 솔루션은 하나의 서비스 항목 중 하나"라며 "기존 재해복구 솔루션 제공 업체에 비해 상대적으로 품질이 낮은 편"이라고 평가했다. 이어 "클라우드는 사용량만큼 과금이 되는 구조인데, 원 서버 데이터가 DR로 가면 과금이 부과된다"며 "중견·중소기업 입장에선 비용만 늘어나는 꼴이 될 수 있다"고 염려했다.

◆ "데이터센터 K-생태계 강화할 호기" 목소리
클라우드든 온프레미스(자체 시스템) 형태든, 이번 카카오 서비스 먹통 사태를 계기로 DR 시스템 구축 압박은 점차적으로 국내에 확대될 전망이다. 하지만 앞서 살펴봤듯이 DR 시스템을 도입하는 데에는 어떤 방식이든 추가 비용이 들 수밖에 없다. 문제는 최근과 같은 경기 위축 국면에서 비상경영을 준비하는 기업들이 이에 대한 투자를 대대적으로 늘리기에는 부담스럽다는 점이다.

한 통신사 고위 관계자는 이번 카카오 서비스 먹통 사태를 계기로 정부가 발상의 전환을 통해 IT 생태계 전반의 경쟁력을 강화하는 방향성을 고민해야 한다고 조언한다. 그는 "DR 시스템을 갖춰야 한다는 취지에는 공감하지만 기존 사업자들이 보기엔 비용 문제가 가장 큰 걸림돌"이라며 "통신 3사와 정부가 합의해 5G 통신망을 공동으로 구축해 투자 및 자원 효율화를 꾀한 사례처럼 데이터센터와 같은 핵심 인프라스트럭처도 IT 업계가 공동으로 구축하면서 비용을 절감하고, 절감된 비용으로 안정성·보안성 투자를 강화하는 방향으로 가야 한다"고 힘주어 말했다. 한정된 투자 재원을 어떻게 효율적으로 이끌어내고 데이터센터 인프라 강화를 도모할 것인지 정부가 과거 사례에서 묘수를 찾아야 한다는 지적이다.

한국데이터센터연합회에 따르면 국내 데이터센터는 2000년 53개에서 2016년 136개 그리고 2024년엔 180개까지 증가할 예정이다. 네이버, KT, LG유플러스, LG CNS 등 국내 유수 기업이 데이터센터를 각각 설립하고 있는 게 대표적인 예다. 다만 유지보수 및 운영 서비스는 해외 업체 솔루션에 의존하고 있다는 게 업계의 설명이다. 국내 업체가 데이터센터(하드웨어)를 공동으로 구축하면서 유지보수·재해복구 등 데이터센터와 관련된 각종 솔루션 개발 생태계를 고도화하면 그만큼 외국산 솔루션에 대한 의존도는 줄이면서 국내 자체 데이터센터 생태계를 강화할 수 있다.

[나현준 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?