속도 높인 엔비디아 ‘AI 슈퍼칩’ … “미친듯이 추론할 수 있어”

황혜진 기자 2023. 8. 9. 11:51
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

엔비디아가 8일(현지시간) 성능을 업그레이드한 새로운 인공지능(AI) 반도체 칩 'GH200 그레이스 호퍼 슈퍼칩'을 공개하면서 관련 업체 간 경쟁이 더 치열해질 전망이다.

젠슨 황 엔비디아 CEO는 "AI 대형언어모델(LLM) 대부분을 GH200으로 돌리면 미친 듯이 추론할 수 있다"며 "LLM의 추론 비용이 크게 줄어들 것"이라고 말했다.

엔비디아는 또 이날 손쉽게 생성형 AI를 개발할 수 있는 플랫폼 'AI 워크벤치'도 조만간 출시한다고 발표했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

■ 차세대 ‘GH200’ 공개
실시간 저장·처리 AI 훈련 특화
80%점유율 시장서 더 독주할듯
누구나 ‘생성형 AI’ 개발자 되는
플랫폼 ‘워크벤치’ 조만간 출시
인터넷 기술과 혁신적 프로세스 3D 렌더링으로 표현한 인공지능(AI) 디지털 개념. 게티이미지 뱅크

엔비디아가 8일(현지시간) 성능을 업그레이드한 새로운 인공지능(AI) 반도체 칩 ‘GH200 그레이스 호퍼 슈퍼칩’을 공개하면서 관련 업체 간 경쟁이 더 치열해질 전망이다. 업계의 경쟁은 처리 속도와 비용을 개선하는 방향과 동시에 누구나 생성형 AI를 만들 수 있는 플랫폼 출시로도 확대될 것으로 보인다.

CNBC 등에 따르면 엔비디아의 GH200은 AI 반도체 시장을 정면 겨냥하고 있다. 생성형 AI 산업이 급성장하는 상황에서 AI를 학습·구현하기 위해 AI 반도체 시장도 함께 커지고 있기 때문이다. 특히 이번에 내놓은 GH200은 엔비디아의 그래픽처리장치(GPU)와 ARM의 컴퓨터프로세서(CPU)를 하나로 결합해 방대한 용량의 데이터를 실시간으로 저장·처리해야 하는 AI 훈련에 특화됐다는 평가를 받고 있다. 또 기존 모델인 H100과 동일한 GPU를 사용하지만, 메모리 용량이 3배로 늘어나 더 큰 규모의 AI 모델을 하나의 시스템에 장착할 수 있다고 엔비디아는 설명했다. 젠슨 황 엔비디아 CEO는 “AI 대형언어모델(LLM) 대부분을 GH200으로 돌리면 미친 듯이 추론할 수 있다”며 “LLM의 추론 비용이 크게 줄어들 것”이라고 말했다.

인공지능(AI) 칩 분야 선두주자인 미국 반도체 기업 엔비디아가 8일 공개한 ‘GH200 그레이스 호퍼 슈퍼칩’. 엔비디아의 최고급 AI 칩인 H100과 같은 그래픽처리장치(GPU)와 141기가바이트의 최첨단 메모리 및 72코어 암(ARM) 기반의 프로세서(CPU)를 결합했다. 엔디비아 제공

현재 AI 반도체 시장에서 엔비디아의 점유율은 80%에 이른다. 특히 A100이나 H100 등은 AI 반도체 시장에서 없어서 못 파는 상황이다. 엔비디아는 이번 GH200 출시를 통해 AI 칩 시장 지배력을 더욱 공고히 하겠다는 전략이다. 앞서 엔비디아는 이 같은 전략을 바탕으로 올 2분기(5∼7월) 매출이 110억 달러(약 14조5000억 원)로 지난해 같은 기간보다 64% 늘어날 것이란 자체 전망을 발표한 바 있다.

승승장구하는 엔비디아에 후발주자들도 속속 도전장을 내밀고 관련 시장은 달아오르고 있다. ‘제2의 엔비디아’로 불리는 AMD는 지난 6월 공개한 최신 AI 반도체 MI300을 앞세워 시장을 공략하고 있다. 2014년 취임한 리사 수 AMD CEO는 지난해 2월엔 AI 반도체 개발에 강점이 있는 자일링스를 인수하고 GPU 사업에 드라이브를 걸고 있다. 인텔 역시 지난 5월 AI 학습용 CPU인 가우디2를 공개하며 엔비디아의 아성에 도전 중이다.

엔비디아는 또 이날 손쉽게 생성형 AI를 개발할 수 있는 플랫폼 ‘AI 워크벤치’도 조만간 출시한다고 발표했다. AI 워크벤치는 클라우드 등에 미리 프로젝트 예시 등을 구축해 누구나 쉽게 생성형 AI를 개발할 수 있도록 하는 플랫폼으로, 후발 주자의 부상을 견제하기 위한 것으로 해석된다. 엔비디아는 또 허깅 페이스에 DCX 클라우드를 접목해 전 세계 수백만 명의 개발자가 생성형 AI 슈퍼컴퓨팅에 연결할 수 있도록 지원할 예정이다. 허깅 페이스는 이용자가 머신러닝 모델 및 데이터 세트를 공유할 수 있는 세계 최대 플랫폼이자 커뮤니티다.

황혜진 기자 best@munhwa.com

Copyright © 문화일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?