[르포]AI 시대 과열하는 GPU‥물로 식힌다

백종민 2024. 11. 11. 11:11
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

수랭식 냉각시스템 급부상
물·액체로 뜨거워진 슈퍼컴퓨터·GPU 식혀
공랭식에 비해 소음 적고 공간 덜 차지해
향후 도입 확산 예상‥선제적 준비 필요

경기도 남양주에 위치한 인공지능(AI) 풀스택(Fullstack) 플랫폼 구축 및 운영 전문기업 엠키스코어 사옥에는 특이한 방이 있다. 목조 주택으로 지어진 사옥에 데이터센터를 가정한 대형 슈퍼컴퓨터시스템을 설치한 것이다. 슈퍼컴퓨터의 양옆으로 붙어 있는 파이프로 액체가 흐르고 있었다. 차가운 액체가 들어가 더운물로 나오는 방식이다. 슈퍼컴퓨터마다 주렁주렁 파이프가 달려 있었다. 수천만 원이 넘는 고가의 전자장비인데 액체가 새어 나와 고장이 나는 일은 없겠냐고 물었더니 그런 일이 없도록 철저한 대비한 시스템이라는 설명을 들을 수 있었다.

김종훈 엠키스코어 상무가 수랭식 냉각 시스템을 위한 칠러를 소개하고 있다. 사진=백종민 기자

수랭식의 장점은 즉시 확인할 수 있었다. 엔비디아의 ‘H100’ 그래픽처리장치(GPU)가 돌아가고 있었지만 다른 데이터 센터와는 소음의 크기가 달랐다. 통상 데이터 센터를 방문하면 손목의 스마트워치가 80db 정도의 소음이 발생하고 있다고 경고했지만, 지난달 21일은 60db 정도에 그쳤다. 김종훈 엠키스코어 상무는 "수랭식 냉각 시스템으로 컴퓨터의 발열을 식히고 있어 소음이 적다"고 설명했다. 김 상무에 따르면 공기를 이용한 냉각에 비해 물이나 윤활유를 사용하는 수랭식 냉각 방식은 데이터 센터의 효율을 극대화하는 동시에 전기 소모와 소음을 줄이는 다양한 장점이 있다.

전자제품인 서버를 액체로 냉각한다는 것은 과거에는 존재하지 않던 기술이다. 인공지능(AI)시대가 열리며 상황이 달라졌다. 많은 열을 발산하는 GPU를 사용하는 서버가 늘어나면서 냉각기술이 주목받고 있다. 오토바이가 공기로 엔진 열을 식히지만, 엔진 크기가 큰 자동차는 라디에이터를 이용해 물로 열을 식히는 것과 같은 원리다. 엠키스코어에 따르면 일반적인 공랭식 서버의 경우 평균 94킬로와트시(㎾h)를 소모하는 데 비해 수랭식 냉각은 전기료를 10% 이상 절감해 약 82㎾h만 사용한다. 전력 소모가 큰 AI 서버 환경에서는 중요한 장점이다.

엔비디아 최신 ‘블랙웰’ GPU의 등장은 수랭식 냉각 기술을 업계 필수로 만들고 있다. 블랙웰 GPU는 이전보다 높은 1000~1200W의 전력을 소모한다. 기존 H100 GPU에 비해 강력한 성능을 발휘하지만, 발열량 증가는 ‘필요악’이다. 일반적인 공랭 방식으로는 이러한 발열을 효과적으로 제어하기 어렵다. 오픈AI의 챗GPT를 위한 컴퓨터 자원을 제공하는 마이크로소프트가 전 세계에서 가장 먼저 도입한 블랙웰 GB200 서버에 세계 최초로 수랭식 방식을 적용했다고 밝히기도 했다.

수랭식 냉각 시스템을 사용한 슈퍼컴퓨터에는 호스나 파이프가 연결돼있다. 오른쪽의 호스로는 차가운 액체가 들어가고 왼쪽의 호스로는 열기를 식힌 뜨거워진 액체가 흘러나온다. 왼쪽의 호스의 온도가 오른쪽에 비해 확연하게 높은 것을 쉽게 알 수 있다. 사진=백종민 기자

수랭식 냉각 시스템을 도입하면 공간적으로 활용성이 높아진다. 데이터 센터 외부에 존재하는 수많은 냉각팬을 없앨 수 있다. 대신 냉동기 냉각창치인 칠러가 필요하다. 엠키스코어 사옥 외부에도 특수 제작한 칠러가 놓여 있었다. 칠러는 주로 냉동창고를 위해 사용됐지만, 이제는 첨단 데이터 서버를 위해 사용된다. 김 상무는 "칠러도 공급 병목 현상이 예상된다. 사전에 주문하지 않으면 제때 공급받지 못할 수 있다"고 말했다. 향후 신형 GPU 도입을 위해 데이터 센터를 설계하려면 일찌감치 수랭식 시스템 도입을 위한 준비에 나서야 한다는 조언이다.

수랭식과 경쟁하는 방식이 액체 냉각이다. 액체에 서버나 컴퓨터를 통째로 담가 열을 식히는 방식이다. 다만 이 방식은 엔비디아가 직접 지원을 밝히지 않고 있다. 엔비디아 관계자는 사회관계망서비스(SNS)를 통해 수랭식 냉각이 차세대 GPU 서버를 수용하는 데이터 센터의 기본 요구사항이라고 강조했다.

이미 국내에도 수랭식 냉각 방식을 적용한 곳이 있다. 국가슈퍼컴퓨터를 운용하는 한국과학기술정보연구원(KISTI)이다. KISTI는 컴퓨터에 직접 파이프를 연결하지는 않은 절반의 수랭식이었다. 이식 KISTI 국가슈퍼컴퓨팅본부장은 "도입 예정인 슈퍼컴퓨터 6호기는 시스템 내부로 파이프나 호스를 직접 연결하는 수랭식 냉각을 도입하는 것이 불가피할 것으로 보인다"고 말했다.

남양주=백종민 기자 cinqange@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?