추론 칩 예고한 엔비디아 …구글·아마존 성능 앞설까

실리콘밸리=김창영 특파원 2026. 3. 15. 17:27
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

세계 최대 인공지능(AI) 칩 업체 엔비디아가 자사의 대표 기술 콘퍼런스인 'GTC 2026'에서 추론 전용 칩을 공개할 것이라는 관측이 제기됐다.

구글과 아마존 등 경쟁사들이 추론에 특화된 자체 AI 칩을 잇따라 개발한 상황에서 엔비디아의 추론용 칩이 시장 구도를 바꿀 수 있을지 주목된다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

GTC 2026 개최
그록 인수 후 첫 제품
에이전틱AI 중심으로
시장 판도 변화 맞춰
추론 칩 라인업 강화
인텔·AMD 긴장 시킬
서버용 CPU 전망도
젠슨 황 엔비디아 CEO가 지난 1월 5일(현지 시간) 미국 라스베이거스에서 열린 CES 2026에서 신제품을 발표하고 있다. 로이터연합뉴스

세계 최대 인공지능(AI) 칩 업체 엔비디아가 자사의 대표 기술 콘퍼런스인 ‘GTC 2026’에서 추론 전용 칩을 공개할 것이라는 관측이 제기됐다. 구글과 아마존 등 경쟁사들이 추론에 특화된 자체 AI 칩을 잇따라 개발한 상황에서 엔비디아의 추론용 칩이 시장 구도를 바꿀 수 있을지 주목된다.

14일(현지 시간) 엔비디아에 따르면 GTC 2026이 16일부터 19일까지 미국 캘리포니아주 새너제이에서 열린다. 전 세계 190여 개국에서 3만 명이 온·오프라인으로 1000개 이상의 행사에 참가한다. 파이낸셜타임스(FT)는 소식통을 인용해 이번 GTC에서 모델 학습이 아니라 추론 중심의 새로운 칩을 공개할 예정이라고 보도했다.

추론용 칩은 엔비디아가 200억 달러(약 29조 원)에 그록을 우회 인수한 후 내놓는 첫 제품이다. 구글의 텐서처리장치(TPU)를 개발한 엔지니어들이 2016년 설립한 그록은 AI 처리 속도를 높이기 위한 언어처리장치(LPU)를 개발해왔는데 엔비디아가 이번에 이를 기반으로 한 첫 제품을 선보일 것으로 예상된다.

엔비디아는 그동안 그래픽처리장치(GPU)로 AI 데이터센터를 장악했지만 시장이 에이전틱(비서형) AI 중심으로 재편되면서 도전에 직면하고 있다. 에이전틱 AI에서는 학습보다 추론이 중요한데 GPU는 비용과 전력 소모가 커 추론에 비효율적이라는 지적이 있다.

엔비디아가 루빈의 뒤를 잇는 차세대 GPU를 공개할지도 관심사다. 지난해 엔비디아는 2026년 루빈, 2027년 루빈 울트라, 2028년 파인만으로 이어지는 GPU 개발 로드맵을 발표했다. 특히 그동안 GTC에서 후속 모델에 대한 힌트를 제공해왔다는 전례에 비춰볼 때 파인만의 특징을 언급할 수 있다.

엔비디아가 에이전틱 AI에 최적화된 중앙처리장치(CPU)를 선보일 수도 있다. GPU 없이 CPU만으로 AI 에이전트를 개발할 수 있는 CPU 전용 서버 랙(프레임 구조물)이 거론된다. AI 가속기는 그레이스·블랙웰, 베라·루빈 조합처럼 CPU와 GPU를 함께 구성해서 만들지만 에이전틱 AI 시대에 위상이 높아진 CPU 중심의 데이터센터 서버를 구현하려는 것이다. 이는 인텔과 AMD에 위협이 될 수 있다.

실리콘밸리=김창영 특파원 kcy@sedaily.com이완기 기자 kingear@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.