AMD 도전에…엔비디아 차세대 AI칩 공개

이덕주 기자(mrdjlee@mk.co.kr) 2023. 8. 9. 17:27
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'GH200 그레이스 호퍼'
메모리 용량 1.7배 늘려
내년 2분기부터 양산
AI개발 플랫폼도 선보여
시장점유율 1위 굳히기

세계적인 반도체 기업 엔비디아가 생성형 인공지능(AI) 추론 작업에 특화된 AI 반도체를 공개했다.

AMD를 비롯해 수많은 추격자를 따돌리고 80%에 달하는 점유율을 유지하겠다는 의지를 보인 것이다.

젠슨 황 엔비디아 최고경영자(CEO)는 8일(현지시간) 미국 로스앤젤레스에서 열린 컴퓨터그래픽스 콘퍼런스 '시그래프 2023'에서 차세대 AI 가속기 플랫폼 'GH200 그레이스 호퍼 슈퍼칩'을 선보였다.

GH200은 엔비디아 최고급 AI 반도체인 그래픽처리장치(GPU) H100과 ARM 기반의 중앙처리장치(CPU)가 탑재된 제품이다. 여기에 고대역폭메모리(HBM) 4세대 제품인 HMB3e를 탑재해 AI 반도체 처리 속도를 높였다. 엔비디아에 따르면 기존 H100 GPU 대비 1.7배 용량과 1.5배 대역폭을 갖췄다. 엔비디아는 내년 2분기부터 GH200을 생산할 계획이다.

HBM은 D램 여러 개를 수직으로 쌓아 기존 D램보다 데이터 처리 속도를 크게 끌어올린 메모리로 삼성전자와 SK하이닉스 등이 생산한다.

황 CEO는 "이 프로세서가 이전 모델보다 훨씬 강력하다"며 "증가하는 AI 컴퓨팅 파워 수요를 충족하기 위해 전 세계 데이터센터 규모를 확장할 수 있도록 설계됐다"고 설명했다.

신형 GH200은 AI 추론에 특화됐다. 데이터를 가지고 AI 모델을 구축하는 것이 학습 작업이라면, 이미 만들어진 모델에 데이터를 입력해 결과를 얻어내는 것이 추론 작업이다. 메모리를 늘려 추론 작업의 성능을 끌어올린 것이다. H100이 80GB 메모리를 보유한 데 반해 GH200 메모리는 141GB로 훨씬 크다.

황 CEO는 "원하는 거의 모든 대규모 언어 모델을 여기에 넣으면 미친 듯이 추론할 수 있을 것"이라며 "(이렇게 되면) 대규모 언어 모델을 추론하는 데 드는 비용이 크게 낮아질 것"이라고 강조했다.

특히 추론 분야에 집중한 제품을 내놓은 것은 두 가지 이유로 예상된다. 먼저 챗GPT, 스테이블디퓨전 등 생성형 AI 시장이 성장하면서 AI 추론 작업에 대한 수요가 폭발하고 있어서다. 챗GPT와 대화하거나 AI로 이미지를 생성하는 일이 많아지고 있다.

두 번째는 AI 반도체 시장에서 추격자를 따돌리기 위한 목적으로 보인다. 최근 AMD는 MI300X라는 경쟁 제품을 내놓고 엔비디아를 공략하고 있다. MI300X도 생성형 AI에 특화된 제품으로 아마존웹서비스(AWS)에 도입될 예정이다. 인텔도 하바나 가우디2라는 AI 반도체로 엔비디아에 도전하고 있다.

엔비디아 AI 반도체를 구매해 데이터센터를 구축하는 클라우드 사업자도 자체적으로 AI 반도체를 제조하고 있다. 구글은 이전부터 텐서처리장치(TPU)를 만들어 현재는 TPU v4를 사용한다. 아마존은 인퍼런시아(추론용)와 트레이니움(학습용)이라는 자체적인 AI 반도체를 보유하고 있다. 한국에서는 네이버가 삼성전자와 손잡고 AI 반도체를 만들고 있고, 리벨리온·퓨리오사AI 같은 스타트업도 AI 반도체를 개발 중이다.

이처럼 엔비디아에 도전하는 AI 반도체는 '추론용' 시장을 먼저 공략하고 있다. 학습용 AI 반도체보다 공략이 쉬울 것이라는 판단에서다. AMD도 MI300X가 추론 영역에서 경쟁사보다 강점이 있다고 강조했다.

엔비디아는 AI 반도체 시장에서 80% 이상을 점유하고 있다. CUDA라는 소프트웨어 플랫폼을 통해 AI 개발자를 자신들 제품에 '록인'시키는 것이 핵심 전략이다. 최근 여러 기업이 생성형 AI 시장에 뛰어들면서 엔비디아의 AI 반도체 수요가 폭발하고 있지만 생산이 이를 따라가지 못하고 있다. 엔비디아 주가는 올해 들어서만 212% 상승해 미국 기업 시가총액 5위에 올랐다.

엔비디아는 손쉽게 생성형 AI를 개발할 수 있는 플랫폼 'AI 워크벤치'도 공개했다. AI 워크벤치를 통해 누구나 GPU를 이용할 수 있고 생성형 AI 크리에이터가 될 수 있다고 엔비디아는 설명했다.

또 엔비디아는 이날 자체적인 AI 생태계를 강화한다는 내용을 발표했다. 세계 최대 머신러닝 플랫폼 허깅페이스에 GPU 클라우드를 제공해 전 세계 개발자가 생성형 AI 슈퍼컴퓨팅에 연결할 수 있도록 지원할 예정이다.

[실리콘밸리 이덕주 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?