머스크 "오픈AI·딥시크보다 우월"…xAI '그록3' 공개

윤정민 기자 2025. 2. 18. 14:42
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

일론 머스크가 이끄는 인공지능(AI) 기업 xAI가 새 AI 모델을 공개했다.

머스크가 오픈AI 'GPT-4o', 앤트로픽 '클로드 3.5 소네트', 딥시크 'V3' 등 경쟁사 거대언어모델(LLM)보다 수학, 과학, 코딩 등에서 수행 성능이 우수한 지구상에서 가장 똑똑한 AI라고 강조했다.

xAI는 생방송에서 그록3이 GPT-4o(오픈AI), 클로드 3.5 소네트(앤트로픽), V3(딥시크) 등 경쟁 모델보다 수학, 과학, 코딩 벤치마크에서 높은 성과를 보였다고 강조했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI GPT-4o, 딥시크 V3보다 벤치마크 점수 높아
오픈AI '딥 리서치'와 유사한 새 에이전트 '딥서치' 공개
머스크 "2년 안에 스페이스X 로켓에 '그록' 탑재될 것"
[서울=뉴시스] 일론 머스크(맨 오른쪽)가 이끄는 인공지능(AI) 기업 xAI가 18일 오후 1시께 xAI 공식 홈페이지를 통해 새 AI 챗봇 모델 '그록(Grok)3' 공개 라이브 방송을 진행했다. (사진=xAI 홈페이지 캡처)


[서울=뉴시스]윤정민 기자 = 일론 머스크가 이끄는 인공지능(AI) 기업 xAI가 새 AI 모델을 공개했다. 머스크가 오픈AI 'GPT-4o', 앤트로픽 '클로드 3.5 소네트', 딥시크 'V3' 등 경쟁사 거대언어모델(LLM)보다 수학, 과학, 코딩 등에서 수행 성능이 우수한 지구상에서 가장 똑똑한 AI라고 강조했다.

xAI는 한국시간으로 18일 오후 1시께 엑스 내 생방송을 통해 새 AI 모델 '그록(Grok)3'을 공개했다.

머스크는 앞서 본인 엑스 계정을 통해 "(그록3은) 지구에서 가장 똑똑한 AI다. 어떤 챗봇보다도 뛰어난 성능을 보인다"고 강조한 바 있다.

그록3 특징은 학습량, 최신 정보 대응 등에 있다. 그록3은 엔비디아 그래픽처리장치(GPU) H100 10만개를 탑재한 콜로서스(Colossus) 슈퍼컴퓨터에서 2억 시간 동안 훈련됐다. 머스크는 그록3이 그록2보다 10배 더 높은 연산력이 투입됐다고 설명했다.

[서울=뉴시스] 일론 머스크(맨 오른쪽)가 이끄는 인공지능(AI) 기업 xAI가 18일 오후 1시께 xAI 공식 홈페이지를 통해 새 AI 챗봇 모델 '그록(Grok)3' 공개 라이브 방송을 진행했다. 사진은 그록3과 경쟁사 모델 벤치마크 비교표 (사진=xAI 홈페이지 캡처)


xAI는 생방송에서 그록3이 GPT-4o(오픈AI), 클로드 3.5 소네트(앤트로픽), V3(딥시크) 등 경쟁 모델보다 수학, 과학, 코딩 벤치마크에서 높은 성과를 보였다고 강조했다.

예를 들어 미국 수학경시대회(AIME) 2024 문제로 모델을 평가한 결과 딥시크 V3는 39%, 클로드 3.5 소네트는 26% 등의 정답률을 기록한 반면 그록3은 52%를 기록했다. AIME 2025에서는 그록3 점수가 오픈AI 'o3-미니-하이'보다 높다고 강조했다.

과학 관련 벤치마크 'GPQA'에서는 V3가 정답률 59%, 클로드 3.5 소네트가 65%, GPT-4o가 50%를 기록했다면 그록3 정답률은 75%라고 주장했다.

머스크는 그록3이 딥시크 R1과 오픈AI o3 미니와 유사한 추론 기능을 갖췄으며 자세한 사고 사슬(CoT, AI가 문제를 풀 때 단계별 중간 사고 과정을 거쳐 해결·추론해 내는 기법) 과정을 사용자에게 공개한다고 전했다.

xAI는 그록3 기반 새 에이전트 '딥서치(DeepSearch)'도 공개했다. 오픈AI '딥 리서치'와 비슷한 도구로 웹 페이지, 엑스 등에서 오랜 시간 검색해 필요한 정보를 제공한다.

엑스 내 콘텐츠 수집은 엑스가 이용약관을 개정했기 때문에 가능했다. 엑스는 지난해 11월부터 엑스 내 모든 콘텐츠를 AI 학습에 사용할 수 있도록 이용약관을 개정했다.

xAI 관계자는 딥서치에 대해 "엔지니어와 연구원, 과학자가 코딩하는 것을 돕는 것뿐만 아니라 실제로 모든 사람이 매일 겪는 질문에 답할 수 있도록 돕는 광범위한 에이전트의 첫 번째 세대"라고 말했다. 머스크도 "웹에서 30분 또는 1시간 동안 조사하거나 소셜 미디어를 검색하는 데 걸리는 작업을 요청하고 돌아오면 10분 후에 1시간 분량의 작업을 대신 해준다"고 강조했다.

xAI는 그록3을 엑스 유료 멤버십 '프리미엄 플러스'(월 2만9000원, 연 30만원) 구독자에게 우선 제공한다고 전했다.

또 월 구독료 30달러(약 4만3000원) 또는 연 구독료 300달러(약 43만원)의 구독 서비스 '슈퍼그록'도 출시한다. 이 서비스는 추가 추론, 무제한 이미지 생성 등을 지원한다.

머스크는 약 일주일 후에 그록3에 음성 어시스턴트 모드도 추가한다며 생방송 마지막에 티저 영상을 공개했다. 또 그록 성능이 지속적으로 발전해 온 만큼 2년 안에 스페이스X 로켓 시스템에 그록 AI가 탑재될 것이라고 전했다.

☞공감언론 뉴시스 alpaca@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.