엔비디아 블랙웰 또 문제? '서버 랙 과열 잡지 못해'

실리콘밸리/오로라 특파원 2024. 11. 18. 06:58
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

젠슨 황 엔비디아 CEO./로이터 연합뉴스

엔비디아의 차기 인공지능(AI) 가속기인 ‘블랙웰’이 서버 과열 문제에 부딪혔다는 보도가 나왔다.

17일 미국 IT전문매체 디인포메이션은 소식통을 인용해 엔비디아가 공급업체들을 대상으로 여러 번 서버 랙(복수의 서버를 저장하는 특수 프레임) 디자인을 변경해 달라고 요청하고 있다고 전했다. 현재 디자인으론 블랙웰을 탑재했을 때 과열 현상이 발생하고 있기 때문이다. 서버 랙과 서버 랙 사이에는 무수하게 많은 케이블과 스위치가 연결돼 있다. 디인포메이션은 “계속 되는 문제에 실제 블랙웰이 탑재된 서버 랙을 사용할 수 있는 시기가 지연될 수 있다는 불안감이 커지고 있다”고 전했다.

앞서 엔비디아의 블랙웰은 대만 TSMC에서 생산되는 과정에 문제가 생겨 실제 출시시간이 늦춰졌고, 양사의 불화설까지 흘러나왔었다. 이에 대해 젠슨 황 엔비디아 최고경영자(CEO)는 불화설을 정면으로 부인하며 블랙웰의 결함은 현재 해결됐다고 밝힌 바 있다. 하지만 이후 생산된 블랙웰로 서버 랙을 제조하는 단계에서도 어려움을 겪고 있다는 것이다.

엔비디아는 고성능 AI 훈련을 위해 서버 랙 당 블랙웰 72개를 탑재하는데, 이는 기존 시중에 있는 제품 대비 GPU의 수가 많은 것이다. 완성품의 무게는 3000파운드(약 1.5t)에 달할 정도로, 그만큼 전례 없는 복잡성으로 디자인이 어려운 것으로 알려졌다. 현재 엔비디아는 이 같은 문제를 고객사에게 알리지 않았지만, 랙 공급업체은 잘못하면 내년 상반기 말쯤에야 랙을 공급할 수 있을 것으로 보고 있다.

엔비디아 측은 이에 대해 “엔지니어링을 되풀이 하는 것은 정상적이고 예상되는 일”이라고 했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?