엔비디아 'AI 추론' 모델·인프라 폭탄투하…'에이전틱 AI' 경쟁 격화

김민석 기자 2025. 3. 20. 06:00
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

엔비디아가 개방형 추론 인공지능(AI) 모델과 추론형 AI 모델 구동에 필요한 플랫폼 및 슈퍼컴퓨터 등을 대거 쏟아내며 빅테크 기업 간 추론 모델 경쟁에 새 국면을 열었다.

알리바바·바이두 등 중국 빅테크 기업에 이어 LG(003550)도 세계 최정상급 자체 AI 모델을 발표하며 AI 시장 주도권 경쟁이 치열해지는 양상이다.

알리바바·바이두 등 중국 빅테크 기업들도 추론 AI 모델 경쟁에 적극 뛰어들고 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

젠슨황 "추론모델 고성능 컴퓨팅 요구, 딱 맞춤 블랙웰 울트라"
中알리바바·바이두 등도 추론모델 발표…LG '엑사원 딥' 참전
US-TECHNOLOGY-INTERNET-SOFTWARE-NVIDIA ⓒ AFP=뉴스1

(서울=뉴스1) 김민석 기자 = 엔비디아가 개방형 추론 인공지능(AI) 모델과 추론형 AI 모델 구동에 필요한 플랫폼 및 슈퍼컴퓨터 등을 대거 쏟아내며 빅테크 기업 간 추론 모델 경쟁에 새 국면을 열었다.

알리바바·바이두 등 중국 빅테크 기업에 이어 LG(003550)도 세계 최정상급 자체 AI 모델을 발표하며 AI 시장 주도권 경쟁이 치열해지는 양상이다.

20일 엔비디아에 따르면 최근 'GTC'에서 공개한 '엔비디아 라마 네모트론' 모델은 메타의 라마 모델을 기반으로 자사 인프라로 사후 훈련(Post-Training)을 거쳐 성능을 대폭 향상시켰다. 라마 네모트론이 다른 주요 개방형 추론 모델보다 처리 속도가 5배 빠르다고 회사 측은 설명했다.

US-TECHNOLOGY-INTERNET-SOFTWARE-NVIDIA ⓒ AFP=뉴스1

엔비디아는 AI 추론 능력을 강화한 '블랙웰 울트라'와 블랙웰 울트라 탑재 제품군도 발표했다. 블랙웰 울트라는 테스트 타임 스케일링(TTS) 추론과 훈련을 강화해 △AI 추론 △에이전틱 AI(AI 에이전트) △물리 AI 애플리케이션(앱) 가속화를 지원한다.

블랙웰 울트라 기반 슈퍼컴퓨터 'DGX SuperPOD'도 공개했다. DGX SuperPOD는 최첨단 기업용 AI 인프라로 산업 전반에 에이전틱 AI(AI 에이전트) 추론을 위한 슈퍼컴퓨팅을 제공한다.

젠슨 황 CEO는 "추론 AI와 에이전틱 AI는 훨씬 더 많은 컴퓨팅 성능을 요구하고 있다"며 "바로 이 순간을 위해 블랙웰 울트라를 설계했다"고 했다.

하드웨어 인프라에 소프트웨어 통합을 택한 엔비디아와는 달리 오픈AI는 소프트웨어와 API 중심 전략을 취하고 있다. 오픈AI는 최근 AI 에이전트용 소프트웨어 개발 플랫폼 '리스폰스 API'를 출시했다.

알리바바·바이두 등 중국 빅테크 기업들도 추론 AI 모델 경쟁에 적극 뛰어들고 있다.

알리바바는 공장 수준으로 AI 모델을 찍어내고 있다는 평가다. 올해 1월 전문가혼합(MoE) 방식을 적용한 '큐원2.5-맥스'를 공개하며 'GPT-4o'를 넘어섰다고 주장했다. 최근 전 세계 인구의 90%가 사용하는 25개 언어를 포함한 오픈소스 대형언어모델(LLM) '바벨'도 공개했다.

바이두는 추론 특화 AI 모델 '어니 X1'과 '어니 4.5'를 최근 발표했다. 모니카는 범용 AI 에이전트 초기 모델 '마누스 AI'를 선봬 관심을 모았다.

엑사원 딥-32B의 수학 영역(왼쪽) 과학과 코딩 영역 성능 비교(LG 제공)

국내 기업들도 추론 AI 가속 흐름에 동참하고 있다. LG는 이달 18일 세계 최정상급 추론형 AI '엑사원 딥'을 오픈소스로 공개하며 동급 모델 기준 오픈AI 모델 및 중국 딥시크 등보다 성능이 우월하다고 설명했다.

업계 관계자는 "하드웨어 강자 엔비디아가 글로벌 주요 테크·클라우드 기업들과 연합군을 꾸리면서 소프트웨어 경쟁력 강화에 나섰다"며 "비용 효율성을 내세운 중국 기업들도 정부 지원을 바탕으로 거세게 도전하고 있어 추론 AI 경쟁은 한층 더 치열해질 것"이라고 말했다.

추론형 모델은 학습한 데이터에 Chain-of-Thought(CoT·사고의 연쇄) 프롬프트 기법을 적용해 상황별 최적의 답변을 생성하며 어떤 과정을 거쳐 결론을 도출했는지 단계별로 보여준다. 인간이 단계적으로 사고하는 방식과 유사하다. 반면 비추론 모델(일반모델)은 질문·지시에 사고의 단계 없이 빠르게 답변한다.

최근엔 복잡한 전략 수립 및 분석에는 추론 모델을, 일상적인 업무 실행과 단순 작업에는 비추론 모델을 활용하는 등 혼합 모델 연구가 이뤄지고 있다.

ideaed@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?