엔비디아 'AI 추론' 모델·인프라 폭탄투하…'에이전틱 AI' 경쟁 격화
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
엔비디아가 개방형 추론 인공지능(AI) 모델과 추론형 AI 모델 구동에 필요한 플랫폼 및 슈퍼컴퓨터 등을 대거 쏟아내며 빅테크 기업 간 추론 모델 경쟁에 새 국면을 열었다.
알리바바·바이두 등 중국 빅테크 기업에 이어 LG(003550)도 세계 최정상급 자체 AI 모델을 발표하며 AI 시장 주도권 경쟁이 치열해지는 양상이다.
알리바바·바이두 등 중국 빅테크 기업들도 추론 AI 모델 경쟁에 적극 뛰어들고 있다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
中알리바바·바이두 등도 추론모델 발표…LG '엑사원 딥' 참전
(서울=뉴스1) 김민석 기자 = 엔비디아가 개방형 추론 인공지능(AI) 모델과 추론형 AI 모델 구동에 필요한 플랫폼 및 슈퍼컴퓨터 등을 대거 쏟아내며 빅테크 기업 간 추론 모델 경쟁에 새 국면을 열었다.
알리바바·바이두 등 중국 빅테크 기업에 이어 LG(003550)도 세계 최정상급 자체 AI 모델을 발표하며 AI 시장 주도권 경쟁이 치열해지는 양상이다.
20일 엔비디아에 따르면 최근 'GTC'에서 공개한 '엔비디아 라마 네모트론' 모델은 메타의 라마 모델을 기반으로 자사 인프라로 사후 훈련(Post-Training)을 거쳐 성능을 대폭 향상시켰다. 라마 네모트론이 다른 주요 개방형 추론 모델보다 처리 속도가 5배 빠르다고 회사 측은 설명했다.
엔비디아는 AI 추론 능력을 강화한 '블랙웰 울트라'와 블랙웰 울트라 탑재 제품군도 발표했다. 블랙웰 울트라는 테스트 타임 스케일링(TTS) 추론과 훈련을 강화해 △AI 추론 △에이전틱 AI(AI 에이전트) △물리 AI 애플리케이션(앱) 가속화를 지원한다.
블랙웰 울트라 기반 슈퍼컴퓨터 'DGX SuperPOD'도 공개했다. DGX SuperPOD는 최첨단 기업용 AI 인프라로 산업 전반에 에이전틱 AI(AI 에이전트) 추론을 위한 슈퍼컴퓨팅을 제공한다.
젠슨 황 CEO는 "추론 AI와 에이전틱 AI는 훨씬 더 많은 컴퓨팅 성능을 요구하고 있다"며 "바로 이 순간을 위해 블랙웰 울트라를 설계했다"고 했다.
하드웨어 인프라에 소프트웨어 통합을 택한 엔비디아와는 달리 오픈AI는 소프트웨어와 API 중심 전략을 취하고 있다. 오픈AI는 최근 AI 에이전트용 소프트웨어 개발 플랫폼 '리스폰스 API'를 출시했다.
알리바바·바이두 등 중국 빅테크 기업들도 추론 AI 모델 경쟁에 적극 뛰어들고 있다.
알리바바는 공장 수준으로 AI 모델을 찍어내고 있다는 평가다. 올해 1월 전문가혼합(MoE) 방식을 적용한 '큐원2.5-맥스'를 공개하며 'GPT-4o'를 넘어섰다고 주장했다. 최근 전 세계 인구의 90%가 사용하는 25개 언어를 포함한 오픈소스 대형언어모델(LLM) '바벨'도 공개했다.
바이두는 추론 특화 AI 모델 '어니 X1'과 '어니 4.5'를 최근 발표했다. 모니카는 범용 AI 에이전트 초기 모델 '마누스 AI'를 선봬 관심을 모았다.
국내 기업들도 추론 AI 가속 흐름에 동참하고 있다. LG는 이달 18일 세계 최정상급 추론형 AI '엑사원 딥'을 오픈소스로 공개하며 동급 모델 기준 오픈AI 모델 및 중국 딥시크 등보다 성능이 우월하다고 설명했다.
업계 관계자는 "하드웨어 강자 엔비디아가 글로벌 주요 테크·클라우드 기업들과 연합군을 꾸리면서 소프트웨어 경쟁력 강화에 나섰다"며 "비용 효율성을 내세운 중국 기업들도 정부 지원을 바탕으로 거세게 도전하고 있어 추론 AI 경쟁은 한층 더 치열해질 것"이라고 말했다.
추론형 모델은 학습한 데이터에 Chain-of-Thought(CoT·사고의 연쇄) 프롬프트 기법을 적용해 상황별 최적의 답변을 생성하며 어떤 과정을 거쳐 결론을 도출했는지 단계별로 보여준다. 인간이 단계적으로 사고하는 방식과 유사하다. 반면 비추론 모델(일반모델)은 질문·지시에 사고의 단계 없이 빠르게 답변한다.
최근엔 복잡한 전략 수립 및 분석에는 추론 모델을, 일상적인 업무 실행과 단순 작업에는 비추론 모델을 활용하는 등 혼합 모델 연구가 이뤄지고 있다.
ideaed@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- 회사 비상계단으로 끌더니 옷 벗기려 한 남편…"당신도 좋잖아" 뻔뻔
- 가출 여중생 협박해 집단 성폭행…"중1인데 성병 진단, 환청 시달려" 울분
- "방세 낸 거니?"…실외기 비둘기 알 옆 만원짜리 지폐 2장 '깜짝'
- "김새론, 뉴욕 남자와 임신 불가능…김수현, N번방 능가" 가세연 폭로 예고
- '홈쇼핑계 전지현' 동지현, 100억 한남더힐 빚없이 샀다
- 박지윤, 한밤중 흰 수영복 입고 볼륨감 과시…제주도 행복 일상 [N샷]
- '부동산 1타강사' 누운 채 가격 당해…아내 구속영장 재신청
- 조진웅, 세금 11억 추징 "세법 해석 차이…과세당국 결정 존중해 전액 납부"
- "이진호, 너 살자고 날 죽이냐"…김새론 매니저, 결혼설 녹취록 제공 부인
- 류담, '똥군기' 논란 인정·해명 "내가 팼지만…개인적 감정은 아냐"(종합)