"MS 먹통 잡는데만 7시간? 의아해"…전문가들 '갸우뚱'한 이유는

홍효진 기자 2023. 1. 26. 13:31
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[서울=뉴시스] 권창회 기자 = 사티아 나델라 마이크로소프트 최고경영자가 15일 오후 서울 강남구 인터컨티넨탈 서울 코엑스에서 열린 '마이크로소프트 이그나이트 스포트라이트 온 코리아'에서 기조연설을 하고 있다. 2022.11.15.

"팀즈에 메일까지 다운돼 회사 회선 문제인가 했는데…MS 때문이네요."

세계 2위 클라우드 플랫폼인 마이크로소프트(MS) '애저'(Azure)가 7시간가량 먹통되면서 국내에서도 피해 사례가 속출하고 있다. 이미 앞서 서비스 장애를 겪은 전력이 있는 데다 1위 아마존웹서비스(AWS) 역시 서버 장애가 반복되고 있다. 이에 클라우드 서비스 전반에 대한 불신이 커질 수 있다는 우려까지 나온다.
"회의 중 팀즈 다운…MS 때문에 업무 차질" 불만 속출
25일(현지시간) 로이터통신 등에 따르면 MS 클라우드 플랫폼 '애저'는 이날 네트워크 장애로 다운된 뒤 약 7시간 만에 복구됐다. MS는 네트워크 롤백(Rollback·장애 발생 이전의 데이터로 복구) 조처를 진행했고 현재 정상적으로 이용 가능한 상황이다. MS는 "서비스가 회복됐고 안정적으로 유지하고 있다"고 말했다. 서비스 장애 원인에 대해선 정확히 밝혀지지 않았다. 현재 MS는 오류 원인을 비롯해 추가 피해 가능성 등을 조사 중이다.
/사진=MS 트위터

애저 장애로 업무용 통합 솔루션인 MS 365 서비스에 포함된 협업 툴 '팀즈'를 비롯해, 개인정보 관리자 응용 프로그램 '아웃룩' '익스체인지 온라인' 등도 먹통이 됐다. 전 세계 1500만개 기업이 이용 중인 MS 애저는 활성 이용자 수만 5억명 이상이다. 아직까지 정확한 규모는 공개되지 않았지만 아메리카, 유럽, 아시아·태평양, 중동, 아프리카 대륙 등 서비스 장애가 광범위하게 발생한 만큼 피해 고객 수도 상당할 것으로 보인다.
실제 해외 이용자들은 MS 애저 공식 트위터에 "애저 포털이 다운됐고 사용 중인 앱(애플리케이션)에도 애저 서비스가 연결되지 않는다","애저 서비스 의존도가 큰데 제대로 업무가 안 되고 있다" 등 불만을 드러냈다. 국내 이용자들 역시 "회의 중 팀즈가 다운돼 회사 회선 문제인 줄 알고 전화로 미안하다고 거듭 사과까지 했다" "급히 재부팅 했는데도 먹통이다" 등 업무에 차질을 빚었다는 반응이 많았다.
MS·AWS 장애 반복…"클라우드 서비스 불신 커질 수도"
주요 클라우드 서비스 먹통 사례는 이번이 처음이 아니다. MS 애저는 2021년 4월에도 미국 서부 지역을 중심으로 검색엔진 '빙'(Bing), 애저 등 서비스에 장애가 발생한 바 있다. 당시 애저는 오프라인 상태로 전환되며 모든 서비스가 중단됐다. AWS는 같은 해 12월에만 세 번이나 통신 장애가 발생했다. 웹사이트 접속 장애를 추적하는 다운디렉터에 따르면 당시 스트리밍 서비스 훌루, 업무용 협업 메신저 슬랙, 가상자산 거래소 코인베이스 등에서 AWS 장애로 인한 문제가 발생한 것으로 알려졌다.

이에 클라우드 서비스에 대한 이용자 불신이 커질 수 있다는 우려가 나온다. 한 클라우드 업계 관계자는 "클라우드 서비스 장애 원인은 네트워크 장애일 수도 있고, 화재 등 외부 재해처럼 환경적 요인까지 여러 가지"라며 "서비스 장애나 중단이 얼마나 단기간에 복구되느냐가 중요하다. 이런 일이 반복되면 고객 불신은 커질 것"이라고 말했다.

또 다른 업계 관계자 역시 "클라우드 서비스는 한 번 장애가 발생하면 피해를 보는 이들이 많을 수밖에 없다"며 "특히 MS나 AWS 서비스는 많은 글로벌 기업들이 사용하고 있는 만큼 동시다발적으로 피해가 몰리게 된다. 서비스 제공업체가 심각성을 느끼고 복구 시스템을 강화해야 한다"고 전했다.

사진은 지난해 6월15일 서울 종로구에 위치한 한국마이크로소프트 출입구 모습. /사진=뉴스1


전문가들은 '클라우드 빅3' 기업 중 한 곳인 MS가 복구에 7시간이나 소요됐다는 점도 의아하다는 반응이다. 유지상 광운대 전자공학과 교수(한국소프트웨어산업협회 SW산업 정책자문단 자문위원)는 "클라우드 규모가 커지다 보니 완전한 관리는 쉽지 않다"면서도 "MS나 AWS, 구글 같은 주요 기업은 시스템 2중·3중화 프로세스를 하고 있는데도 MS가 7시간이나 먹통됐다는 건 의아한 상황"이라고 말했다.

나종회 광주대 컴퓨터공학과 교수는 "장애 복구 수준은 결국 비용 문제와 결부되기 때문에 보통 시스템은 2중·3중화를 하더라도 네트워크는 듀얼 체계로 가는 경우가 많다"며 "장애 발생 빈도를 따졌을 때 발생이 적은 부분엔 2중화를 하고 자주 발생하는 곳에는 3중화를 하는 등 나눠서 운영하기도 한다"고 말했다.

나 교수는 "MS가 2중·3중화를 제대로 했다면 복구에 7시간이나 걸리진 않았을 것"이라며 "장애는 언제든지 일어날 수 있다는 가정하에 제대로 대응할 수 있는 복구 체계를 갖추는 것이 무엇보다 중요하다"고 덧붙였다.

홍효진 기자 hyost@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>

Copyright © 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?