[르포]"특별한 기름에 푹~ 담갔더니...열 받은 AI서버, 확 식었다"

안하늘 2023. 12. 16. 04:31
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

국내 최초 액침냉각 효과 입증한 SK텔레콤
찬 공기로 서버 열 낮추는 기존 방식 대신
특수 냉각유를 활용…전력 37% 절감 효과
'에이닷' 등 AI 전용 데이터센터에 도입
13일 방문한 인천 남동구 SK텔레콤 인천 사옥 내 IDC 시설. SKT는 실제 IDC 환경에서 액침 냉각 서버를 실험, 효과를 입증하는 데 성공했다. 안하늘 기자

영화 속 해커들이 침입하는 데이터센터(IDC)의 모습은 빽빽하게 서 있는 서버가 빼곡히 차 있고 굉음이 들리는 모습이다. 하지만 13일 찾은 인천 남동구 SK텔레콤 인천 사옥 내 IDC에는 관처럼 뚜껑이 덮여 있는 서버가 덩그러니 누워 있었다. 또 비릿한 기름 냄새를 맡을 수 있었다.

이곳은 SKT가 인공지능(AI) 전용 IDC를 만들기 위해 '액침 냉각' 기술을 꼼꼼하게 따져보는 '검증소'다. 아이폰 통화 녹음, 실시간 통역 서비스 등 다양한 AI 서비스를 내놓고 있는 SKT는 뜨거워진 서버를 식히기 위해 기름 속에 서버를 넣겠다는 과감한 방식을 택했다. 실제 IDC 환경에서 액침 냉각 기술의 효과를 입증한 건 국내에서는 SKT가 처음이다. 이를 바탕으로 SKT는 최근 인천 사옥 IDC 시설을 대대적으로 개편, 내년 중 곳곳에 흩어진 AI용 서버를 이곳에 모은 뒤 액침 냉각 기술을 접목한다는 계획이다.

보안이 철저한 IDC답게 입장부터 여러 차례 인증을 받아야 했다. 특히 액침 냉각이 적용된 서버는 IDC 가장 안쪽에서 따로 검증 중이었다. 서버를 덮고 있는 뚜껑을 열어보니 수많은 전선으로 연결된 장치가 기름 속에 풍덩 담긴 채 돌고 있었다. 다른 한쪽에선 짧은 시간 내 물을 데워주는 발열봉이 수십 개 꽂혀 있었다.

최우신 SKT 인프라 엔지니어링팀 매니저는 "HP나 델 등 기존 서버 업체들의 제품부터 AI 반도체인 '사피온'이 들어간 서버까지 60여 대를 대상으로 실험하고 있다"며 "눈 깜짝할 새 200도 이상 올라가는 발열봉 70개까지 작동시키는 가혹한 조건에서도 서버를 둘러싸고 있는 기름 온도를 40도로 유지하는 데 성공했다"고 말했다.


냉수로 찬 공기 만드는 대신 냉각유에 '풍덩'

특수 냉각유 속에 담겨있는 액침 냉각 서버. 안하늘 기자

SKT가 액침 냉각 기술을 IDC에 적용한 이유는 전력 사용량을 줄이면서도 고성능의 그래픽처리장치(GPU)를 가동하기 위해서다. 지난해 챗GPT를 시작으로 AI 서비스가 대중화되면서 이를 가동하기 위한 IDC 인프라의 중요성도 커지고 있다. 엄청난 양의 데이터를 처리해야 하는 만큼 IDC 업체들은 최첨단 GPU를 구축한 서버를 경쟁적으로 늘리고 있다. 문제는 그 과정에서 막대한 열이 생긴다는 점이다.

GPU를 비롯한 모든 반도체는 운영 과정에서 85도 이상의 고온이 되면 스스로 성능을 제한하는 '스로틀링' 기능을 갖추고 있다. 발열을 제대로 제어하지 못하면 기기의 수명과 배터리에 나쁜 영향을 주기 때문이다. 특히 기존 중앙처리장치(CPU) 서버보다 더 많은 데이터를 처리하는 GPU는 열에 더욱 취약하다. 이에 GPU 성능을 100% 구현하기 위해서는 서버의 열을 안정적으로 유지하는 것이 중요하다.

주요 IDC 업체들은 그동안 7~10도 정도의 물로 찬 공기를 만들어 IDC의 열을 낮추는 수랭식 공기냉각 방식을 써왔는데 간접적으로 열기를 낮추다 보니 효율이 떨어지고 차가운 물을 만드는 데도 비용이 많이 들었다.

반면 액침 냉각은 특수 냉각유에 서버를 직접 담그는 만큼 온도를 곧바로 낮출 수 있다. 서버의 열 때문에 온도가 오른 냉각유는 펌프를 통해 시원한 물과 접촉시켜 열을 식히고 미리 식혀둔 냉각유가 다시 투입되는 순환 구조다. 실제 SKT의 실험 결과 기존 공기 냉각 대비 냉방 전력의 93%, 서버 전력에서 10% 이상이 절감돼 총전력 37%가 절감되는 효과를 확인했다.


GPU 서버 일반 서버 대비 전력 사용량 20~30배

게티이미지뱅크

전자제품을 담가도 제품이 고장 나지 않는 특수 냉각유와 특수유의 온도를 유지하기 위한 열 순환 구조를 실제 IDC 환경에서 구축하는 것이 쉽지 않았다. SK엔무브가 액침 냉각을 위해 전기 전도도가 '0'인 특별한 기름을 만들었고 이를 활용한 솔루션은 SK엔무브가 지난해 2,500만 달러를 투자한 미국의 GRC가 맡았다. 미국 국가안보국(NSA) 및 인텔 등에서 이 회사의 기술을 적용했다.

AI 시대가 다가올수록 액침 냉각 솔루션 도입의 필요성이 커질 것이라고 SKT 측은 설명했다. 기존 공기냉각 방식으로 AI서비스를 위한 IDC를 운영하는 데 한계에 다다랐기 때문이다. 최 매니저는 "AI를 위한 GPU 서버가 기존 서버 대비 전력 사용량이 20~30배 많다"며 "발열 관리 차원에서 기존 방식으로는 1개의 서버 렉(받침대)당 2개의 GPU 서버를 달 수밖에 없는 반면 액침 냉각으로 하면 7대까지 장착할 수 있어 효율적"이라고 말했다.

실험 과정 중 예상치 못한 효과도 있었다. 최 매니저는 "서버의 주요 고장 원인이 먼지나 습도인 만큼 용액에 담그면 서버가 더 작동할 수 있을 것"이라며 "열 걱정 때문에 서버의 최고 성능에 제한을 걸었던 것에서도 자유롭게 됐다"고 말했다.


"초기 비용 들고, 유지 보수 불편하지만 중장기적 비용 절감"

1월 16일 서울 강남구 코엑스에서 열린 'SK 테크 서밋 2023'에서 액침 냉각 시스템이 전시돼 있다. 뉴시스

반면 서버가 특수 용액에 담긴 만큼 유지·보수하는 데는 불편할 수밖에 없다. 최 매니저는 "용액에서 꺼내서 서버를 매달아 놓고 기름이 다 빠질 때까지 기다려야 한다"며 "서버 업체들이 액침 냉각한 제품에 대한 사후 지원을 어떻게 할지 확실히 정해지지 않았다는 점도 아쉽다"고 말했다.

수천 리터에 달하는 기름통이 IDC에 있는 만큼 화재 사고에 대한 우려도 나온다. 최 매니저는 "특수유 자체가 발화점이 300도 이상이고 폭발성이 있는 물질이 아니라 불안 요소는 적다"면서 "전문 기관으로부터 유해성 검증도 받았고 쓰고 난 뒤 절차에 따라 버리고 있다"고 말했다.

상당한 초기 투자비가 드는 기술임에도 SKT는 중장기적으로 액침 냉각 기술이 앞으로 대세가 될 것으로 기대하고 있다. 이미 구글, 마이크로소프트(MS)도 적용 가능성을 테스트 중인 것으로 전해진다. 최 매니저는 "현재 주요 AI 기업들 모두 액침 냉각 기술을 검토하는 것으로 알고 있다"고 말했다.

인천= 안하늘 기자 ahn708@hankookilbo.com

Copyright © 한국일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?