오픈AI, '세레브라스 칩 구동' 첫 AI모델 공개…엔비디아 경쟁사

권영전 2026. 2. 13. 09:58
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI가 엔비디아의 경쟁사인 세레브라스의 칩으로 구동되는 인공지능(AI) 모델을 처음으로 내놨다.

오픈AI는 실시간 코딩 작업에 특화한 신규 모델 'GPT-5.3-코덱스-스파크'를 12일(현지시간) 공개했다.

오픈AI는 이 모델의 고속 추론 성능을 위해 엔비디아의 그래픽처리장치(GPU) 대신 세레브라스의 '웨이퍼규모엔진3'(WSE-3)을 통해 구동한다고 밝혔다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

초(超)저지연 모델 'GPT-5.3-코덱스-스파크'…"엔비디아 GPU는 여전히 핵심 기반"
[로이터=연합뉴스 자료사진. 재판매 및 DB 금지]

(샌프란시스코=연합뉴스) 권영전 특파원 = 오픈AI가 엔비디아의 경쟁사인 세레브라스의 칩으로 구동되는 인공지능(AI) 모델을 처음으로 내놨다.

오픈AI는 실시간 코딩 작업에 특화한 신규 모델 'GPT-5.3-코덱스-스파크'를 12일(현지시간) 공개했다.

이 모델은 지난 5일 공개한 'GPT-5.3-코덱스'의 경량 모델로, 복잡한 연산보다는 빠른 작업 처리에 중점을 맞췄다.

오픈AI는 이 모델이 초당 1천 개 이상의 토큰을 처리할 수 있어 사용자가 지연시간을 거의 느끼지 못하는 '초(超)저지연' 환경을 제공한다고 설명했다.

토큰은 AI 모델이 처리하는 데이터의 단위로, 영어 데이터를 기준으로 할 때 일반적으로 단어 하나가 1토큰에 해당한다.

이를 통해 개발자들이 코딩 작업 과정에서 오류를 수정하는 등 작업을 할 때 즉각적인 AI 답변을 받을 수 있어 효율성이 높아질 것으로 추정된다.

오픈AI는 이 모델의 고속 추론 성능을 위해 엔비디아의 그래픽처리장치(GPU) 대신 세레브라스의 '웨이퍼규모엔진3'(WSE-3)을 통해 구동한다고 밝혔다.

엔비디아를 비롯한 대다수 반도체 제조사가 웨이퍼를 잘게 잘라 여러 개의 칩을 만드는 것과 달리 세레브라스는 하나의 웨이퍼를 통째로 사용하는 거대한 칩을 생산한다.

이에 따라 엔비디아의 AI 칩은 메모리 칩과 통신하는 데 시간과 전력을 소모하는 반면, 세레브라스의 칩은 적은 전력을 쓰고 응답 속도도 높일 수 있는 것이 특징이다.

반도체 스타트업 세레브라스의 '웨이퍼스케일엔진'(WSE). [세레브라스 제공. 재판매 및 DB 금지]

오픈AI는 이번 협력에 대해 "세레브라스와의 파트너십에서 첫 번째 이정표"라고 의미를 부여했다.

다만 오픈AI는 "(엔비디아의) GPU는 여전히 우리의 훈련·추론 작업 전반에 걸쳐 핵심적인 기반"이라며 "세레브라스는 극도로 낮은 지연시간을 요구하는 작업환경에서 탁월한 성능을 발휘해 이 기반을 보완한다"고 부연했다.

오픈AI는 세레브라스에서 750㎿(메가와트) 규모의 연산력을 공급받는 다년 계약을 체결했다고 지난달 14일 발표했다.

미국 언론들은 이달 초 오픈AI가 엔비디아 칩을 이용한 챗GPT 답변에 만족하지 못해 대안을 모색하고 있다고 보도한 바 있다.

오픈AI는 이외에도 미국 반도체 제조사 브로드컴과 협업해 자체 AI 칩을 개발하고 있다.

comma@yna.co.kr

▶제보는 카톡 okjebo

Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지