화제의 엔비디아 ‘베라 루빈’ 슈퍼칩, 한국서는 ‘그림의 떡’ 될까

‘블랙웰’ 대비 AI 매출 기회 최대 10배 기대
국내는 슈퍼칩 기반 시스템 도입 사례 없어

엔비디아의 연례 개발자 행사인 'GTC 2026'에서 공개된 차세대 인공지능(AI) 플랫폼 '베라 루빈(Vera Rubin)'이 업계의 관심을 끌고 있다. 엔비디아는 이 플랫폼이 현 세대 '블랙웰' 대비 AI 서비스에서 창출 가능한 매출 기회를 최대 '10배'까지 확대할 것으로 기대하고 있다. 이미 마이크로소프트 등 글로벌 하이퍼스케일러 사업자들은 이 '베라 루빈' 플랫폼을 시험 도입해 활용 중인 것으로 알려졌다.

다만 국내에서는 엔비디아가 강조하는 이러한 '슈퍼칩' 기반 시스템 도입 사례가 거의 없어 실제 공급이 이뤄지더라도 활용이 쉽지 않을 수 있다는 우려가 제기된다. 현재까지 국내에 들어온 엔비디아 GPU 기반 서버는 대부분 인텔이나 AMD의 CPU와 엔비디아의 GPU를 결합한 'NVL8'급 설계다. 반면 엔비디아가 강조하는 '슈퍼칩' 기반 시스템은 아직 국내에 도입된 사례가 없는 것으로 파악된다.

블랙웰 GPU 기반 수랭식 NVL8 디자인인 델 파워엣지 XE9785L / 권용만 기자

엔비디아 GPU 서버의 두 가지 유형, 'NVL8'과 '슈퍼칩'

현재 엔비디아의 GPU 서버 구성은 크게 두 가지로 나뉜다. 첫 번째는 지금까지 이어져 오던 일반적인 x86 서버 구성에 GPU를 탑재한 형태다. 물론 여기서도 기술적인 구성 차이가 있지만, 일반적으로 가장 많이 사용되는 것은 인텔이나 AMD의 프로세서와 엔비디아의 GPU 8개를 장착하고, 프로세서와 GPU는 PCIe로, 8개의 GPU간에는 NV링크(NVLink)로 고속 연결한 'NVL8' 디자인이다. 현재 대부분의 GPU 서버가 이 디자인을 따라가며, 엔비디아의 'DGX'에도 이러한 구성이 있다.

이 디자인의 특징은 지금까지 익숙한 x86 서버처럼 쓸 수 있으면서 8개 GPU까지는 NV링크를 통해 한 개의 GPU처럼 확장된 형태로 쉽게 사용할 수 있다는 점이다. 하지만 GPU가 GPU 내부나 NV링크로 연결된 GPU를 넘어 CPU 쪽의 메모리나 네트워크로 연결된 다른 시스템의 자원을 쓰게 되면 대역폭 등의 문제로 성능이 크게 떨어진다. 이 디자인은 서버 한 대의 경계 안에서 AI 워크로드를 처리하는 데 최적화된 구성을 갖췄다고 볼 수 있다. AMD나 인텔 등 경쟁사들의 서버 디자인도 이 'NVL8'이 주력이다.

하지만 '슈퍼칩'은 이와는 다른 방식으로 접근한다. 지난 세대 '그레이스 호퍼 슈퍼칩(Grace Hopper Superchip)'으로 처음 등장한 이 '슈퍼칩' 개념은 실제로는 엔비디아의 CPU와 GPU를 하나의 보드 위에 근접 배치하고, 두 칩을 전용 'NV링크-C2C'로 연결한 모듈 구조다. CPU와 GPU를 NV링크로 연결한 만큼, CPU와 GPU가 가진 모든 메모리를 공유할 수 있어 모듈 단위에서도 GPU에 더 큰 메모리가 장착된 효과를 기대할 수 있다.

이 '슈퍼칩'의 핵심은 '확장성'이다. 모듈과 노드 단위에서 외부로 NV링크 연결이 나가고, 이를 랙 단위에서 스위치로 직접 연결해 랙 전체의 GPU가 자원을 공유하고 하나의 GPU처럼 움직일 수 있다. 현재의 '그레이스 블랙웰'이나 차세대 '베라 루빈'은 한 랙 안에서 72개의 GPU를 NV링크로 직접 연결하는 구조를 갖춰서 'NVL72'라 부른다. 그리고 이를 랙 간 연결까지 확장해 궁극적으로는 데이터센터 전체를 단일 GPU처럼 연결할 수 있는 개념이다. AMD의 '헬리오스' 랙스케일 솔루션도 이 '슈퍼칩'과 비슷한 구조를 추구한다.

슈퍼칩 기반 시스템은 일반적인 'NVL8' 기반 환경과 비교해, 같은 세대 GPU를 기반으로 하더라도 메모리와 네트워크 확장성에 힘입어 차별화된 성능을 제공할 수 있다. 이번 GTC 2026에서 젠슨 황 엔비디아 CEO가 강조한 AI 팩토리의 생산성 측면에서 '베라 루빈'이나 '그레이스 블랙웰'이 이전 세대 '호퍼 NVL8' 대비 큰 폭의 성능 차이를 내는 데는 GPU 뿐만 아니라 구성 방법의 차이도 영향을 준 모습이다.

또 다른 '슈퍼칩'의 특징은 CPU다. 현재 엔비디아는 슈퍼칩에 Arm 기반 자체 CPU를 사용하고 있다. 익숙한 x86 기반 CPU를 사용하지 않는 이유의 핵심은 GPU와의 'NV링크' 연결 때문이다. 지난해 엔비디아는 인텔과의 협력을 발표하면서 데이터센터용 커스텀 CPU 공동 개발을 언급했는데, 이를 통해 인텔의 제온 CPU에 NV링크 연결을 포함해 인텔 CPU와 엔비디아 GPU가 조합된 슈퍼칩의 등장도 예상되고 있다. 물론 엔비디아는 지속적으로 CPU 개발을 진행한다는 입장이고, '베라' CPU는 슈퍼칩 구성 뿐만 아니라 단독 판매에도 나선다.

아직 '슈퍼칩' 기반 시스템 국내 도입사례 알려지지 않아

엔비디아의 슈퍼칩은 '그레이스 호퍼'와 '그레이스 블랙웰'을 거쳐 이제 '베라 루빈'으로 3세대를 맞는다. 이미 글로벌 하이퍼스케일러 사업자들은 기존 슈퍼칩 기반 시스템을 대량 도입하기도 했다. 몇 개의 랙으로 구성된 모듈 단위 도입은 초기 비용과 설치 난이도가 높지만 성능과 효율이라는 확실한 장점이 있다.

하지만 국내에서는 이러한 '슈퍼칩' 기반 시스템 도입 사례가 알려진 바 없다. 최근까지 '블랙웰'을 도입했다는 발표도 모두 'B200' GPU로 알려졌다. 이 B200 GPU는 GPU만 있는, NVL8 디자인에 사용되는 모델이다. 슈퍼칩의 경우 그레이스 호퍼의 경우 'GH200', 그레이스 블랙웰은 'GB200' 등으로 명칭이 다르다.

익명의 서버 업계 관계자들은 이에 대해 "국내에는 아직 슈퍼칩을 도입한 고객사가 없었던 것으로 안다"며 "앞으로 슈퍼칩 도입 사례를 만드는 것에도 좀 더 힘을 쏟고자 하지만 쉽지 않을 듯 하다"고 말했다.

국내에 슈퍼칩 기반 도입 사례가 없는 이유로는 가격과 기술적 특징이 꼽힌다. 먼저 가격 측면에서는 높은 초기 도입 비용과 운영 환경 확보가 꼽힌다. 최소 단위에서도 몇 개의 랙과 함께 수십~수백 억원에 달하는 하드웨어 비용이 들어가며, 고밀도 전력 공급과 수랭 시설이 가능한 설치 공간도 확보해야 하기 때문이다. 이에 시스템 단위로 구입해 초기 비용 부담을 줄일 수 있는 NVL8 기반이 많이 선택된다는 해석이다.

비용이나 시설의 부담을 넘어설 수 있는 새로운 데이터센터 도입 프로젝트에서도 슈퍼칩이 선택되지 않은 이유로는 '생태계'가 꼽힌다. 특히 Arm 기반 CPU를 사용하는 환경에서 기존 데이터센터 운영 환경과의 호환성 문제가 언급된다. 한 서버 업계 관계자는 "Arm 기반 서버의 경우 실제 운영 환경에서 예상보다 기업 내부 프로그램들에서 호환성 문제에 많이 직면한다"고 지적하기도 했다.

Arm 아키텍처 기반의 슈퍼칩 환경이 주위에서 접하기 힘든 환경이다 보니 '생소함'도 문제다. 하지만 이 '생소함'은 엔비디아가 지난해 선보인 개인용 시스템 'DGX 스파크'나 하반기 중 공급 예정인 'DGX 스테이션'으로 일정 정도 해소할 수 있을 전망이다. 이를 통해 개인 사용자 수준에서도 Arm CPU와 엔비디아 GPU 조합의 '슈퍼칩' 구성을 사용할 수 있기 때문이다. 이들 시스템의 활용이 늘어나면 슈퍼칩 기반 환경으로의 접근성도 자연스레 높아질 것으로 기대된다.

실제 국내에 '베라 루빈'이 도입된다면 그 대상은 비용과 환경, 기술적 부담을 감당할 수 있는 대기업 혹은 대형 클라우드 사업자가 될 것이라는 게 현실적인 전망이다. 하지만 지금까지 이들 기업들이 이미 이전에 있었던 몇 번의 기회에서 '슈퍼칩' 기반 환경을 도입할 수 있었으면서도 외면한 부분은 앞으로도 과제로 남을 것으로 보인다. 실제 '베라 루빈'이 공급될 때 국내 AI 산업계가 이를 어떻게 소화할 수 있을지 기대보다는 우려가 앞서는 것이 현재 상황이다.

권용만 기자

yongman.kwon@chosunbiz.com

IT조선에서 직접 확인하세요. 해당 언론사로 이동합니다.

IT/과학

화제의 엔비디아 ‘베라 루빈’ 슈퍼칩, 한국서는 ‘그림의 떡’ 될까