점점 뜨거워지는 반도체…열 내리는 기업이 ‘칩 워’의 승자 [위클리반도체]
첨단 GPU 72대 연결 엔비디아 서버
평상시 정상 온도만 최대 85도 달해
발열 이슈로…반도체 주식 한때 출렁
신소재·냉각 혁신으로 발열 해결책 모색
반도체 연산 성능을 높이면 높일수록, 점점 더 뜨거워져 한계에 부딪힌다는 점입니다. 마치 초고성능 엔진을 장착한 자동차가 속도를 높일수록 엔진의 열이 감당하기 어려운 수준에 달하는 것과 같은 이치입니다. 그동안 반도체 발열은 큰 문제가 안 됐습니다. 하지만 발열 문제는 10nm(나노미터·1나노미터는 머리카락 굵기의 10만분의 1) 이하 공정부터 점진적으로 발생하다, 7nm 공정에 접어들면서 본격적으로 나타났습니다. 공정이 미세화될수록 발열 문제는 심화할 가능성이 큽니다. 반도체의 최소 단위는 트랜지스터입니다. 트랜지스터는 0과 1의 이진 신호를 제어해 데이터를 처리합니다. 오늘날 칩은 수십억 개에서 수조 개에 달하는 트랜지스터로 구성돼 있습니다. 예를 들어 반도체를 3nm와 같은 미세 공정에서 생산한다는 뜻은 그만큼 반도체 소자인 트랜지스터를 내부에 더 많이 밀집시키는 것을 가리킵니다.
반도체 업계를 이끄는 엔비디아 역시 예외는 아닙니다. 엔비디아는 차세대 그래픽처리장치(GPU)인 ‘블랙웰(Blackwell) B200’의 발열 문제로 한바탕 홍역을 앓았습니다. 블랙웰은 올 3월 선보인 괴물 GPU인데요. 연산 단위인 트랜지스터 2080억개를 탑재해, 연산 성능이 무려 20페타플롭(PetaFlops)에 달합니다. 초당 2경 번에 달하는 계산이 가능합니다.
블랙웰 B200은 인공지능(AI)을 학습·추론하는 AI 가속기의 근간입니다. 블랙웰 B200 2대에 중앙처리장치(CPU)인 그레이스 1대, 그리고 고대역폭 메모리인 HBM3E 16대를 결합하면 AI 칩인 ‘GB200’이 됩니다. GB200은 막강한 AI 가속기입니다. 챗GPT 근간이 되는 GPT-3.5를 기준으로 놓고 보면, 종전 모델인 H100보다 성능이 7배, AI 학습 속도는 4배나 빠릅니다. 이게 끝이 아닙니다.
하지만 이러한 고성능 설계에는 한계가 따릅니다. 고밀도 반도체들을 한 곳에 담아 두다 보니, 서버 랙(server rack) 1개가 무려 120Kw 에너지를 소모합니다. 이는 가구 120곳이 사용할 전기입니다.
높은 전기 소모는 엄청난 발열로 이어집니다. GPU 칩은 컴퓨터가 특별한 작업을 하지 않는 상황인 유휴 상태(Idle)에서는 30~50도, 작업을 할 때인 부하 상태(Load)에서는 60~85도에 달합니다. 만약 발열 관리에 실패해 내부 온도가 85도를 넘어서면, 반도체는 망가집니다.
이 때문에 성능을 꾸준히 높이면서, 발열을 제어하는 것은 매우 어려운 숙제입니다. 얼마 전에는 TSMC와 엔비디아가 충돌을 빚었다는 소식이 있었습니다.
황 CEO는 “오류를 수정하기 위해 7가지 종류의 칩을 처음부터 설계하고, 동시에 생산에 투입해야했다”면서 “TSMC가 한 일은 수율 난항에서 회복할 수 있도록 우리를 돕고, 놀라운 속도로 블랙웰 생산을 재개하도록 도와준 것 뿐”이라고 설명했습니다.
이런 블랙웰(Blackwell) B200은 우여곡절 끝에 올 10월 대량 생산에 돌입할 수 있었습니다. 또 델과 같은 일부 엔비디아 고객사는 GB200 NVL72과 같은 서버 랙까지 이미 주문한 상태입니다. 하지만 또 발열 문제가 불거졌습니다.
오늘날 아마존 AWS, 마이크로소프트 애저, 구글 클라우드와 같은 클라우드 기업들은 자체 인공지능 칩인 NPU (Neural Processing Units)를 설계해 사용하면서도, 엔비디아 GPU를 대량 구매하고 있습니다. 그만큼 데이터센터용 반도체에 대한 수요가 높은 것입니다. 따라서 블랙웰 서버 일정이 늦어질 경우, 데이터센터 구축 계획 일정도 지연될 가능성이 있습니다.
발열 문제는 엔비디아뿐만은 아닙니다. 삼성전자 엑시노스, 퀄컴 스냅드래곤 810, 애플 M2 역시 발열 이슈를 한 차례씩 겪었습니다.
신소재 개발 역시 적극적입니다. 대표적인 것이 탄소 원자가 육각형 벌집 모양의 2차원 평면을 이루는 단층 구조 신소재인 그래핀(Graphene)입니다. 두께가 0.34nm로 지금껏 발견된 가장 얇은 소재인데요. 열전달 속도가 매우 빨라 냉각 소재로 주목받고 있습니다. 삼성전자는 그래핀 방열재를, IBM은 그래핀 트랜지스터를 연구 중입니다. 또 전력 효율이 우수한 갈륨 나이트라이드(GaN)와 탄화 규소(SiC)에 대한 도입 역시 활발합니다.
후공정인 패키징 단계에서도 열관리 연구가 활발합니다. 삼성전자, TSMC, 인텔은 TSV (Through-Silicon Via)를 적극 연구중입니다. 실리콘 웨이퍼(반도체 칩)를 수직으로 관통하는 구멍(via)을 통해 전기 신호를 연결하는 기술인데요. 이를 통해 데이터 전송 속도를 높이고, 발열 문제를 해결할 수 있다고 합니다.
클라우드 기업은 데이터센터 서버 자체 열을 식히는 방법을 연구하고 있습니다. 대표적으로 서버 자체를 비전도성 액체에 담가 열을 관리하는 액침 냉각(Immersion Cooling)이 있습니다. 특히 구글은 핀란드와 싱가포르 데이터 센터에서 액침 냉각 기술을 활용 중입니다. 마이크로소프트는 한 걸음 더 나아가 액침 냉각에서 발생한 열을 인근 시설 난방 에너지로 활용하는 방안까지 개발하고 있습니다.
열을 잘 관리하는 기업이 미래 반도체 패권을 잡을 가능성이 높습니다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “나도 나쁜 면 있는데 참았다”...11살 연하와 결혼하는 김종민 ‘찐팬’ 만나 고백한 이유 - 매
- 보아, 19살때 10억에 산 청담동 건물…지금은 시세차익만 무려 71억 - 매일경제
- “비트코인 33만개 가지고 있다”...하루에 7천억씩 불어난다는 ‘이 회사’ - 매일경제
- “이혼 전 딱 한번 했는데, 도장 찍은 다음날 임신 알아”…42살 아내의 기막힌 사연, 결말은 - 매
- “27세 남성과 15세 소녀의 정사”…외설 논란 일으켰던 이 작가의 책 [Books] - 매일경제
- “국민 100명 참관에도 33.2억·8명 무더기 당첨”…1등 판매한 곳 보니 - 매일경제
- “입대하면 빚 1억3500만원 탕감”...확실한 혜택 준다는 이 나라, 얼마나 다급하길래 - 매일경제
- “코인으로 이제야 돈좀 벌고 있는데”...수익 ‘22% 과세’ 놓고 시끌 - 매일경제
- “돈 많이 벌어 빌딩 사라”...전유성, 조세호 결혼식 주례때 당부한 이유 - 매일경제
- ‘미쳤다!’ 손흥민 환상 중거리 및 5호 도움 폭발! 토트넘, 맨시티 원정서 2년 9개월 만에 승리…