오픈AI, '세레브라스 칩 구동' 첫 AI모델 공개…엔비디아 경쟁사

초(超)저지연 모델 'GPT-5.3-코덱스-스파크'…"엔비디아 GPU는 여전히 핵심 기반"

(샌프란시스코=연합뉴스) 권영전 특파원 = 오픈AI가 엔비디아의 경쟁사인 세레브라스의 칩으로 구동되는 인공지능(AI) 모델을 처음으로 내놨다.

오픈AI는 실시간 코딩 작업에 특화한 신규 모델 'GPT-5.3-코덱스-스파크'를 12일(현지시간) 공개했다.

이 모델은 지난 5일 공개한 'GPT-5.3-코덱스'의 경량 모델로, 복잡한 연산보다는 빠른 작업 처리에 중점을 맞췄다.

오픈AI는 이 모델이 초당 1천 개 이상의 토큰을 처리할 수 있어 사용자가 지연시간을 거의 느끼지 못하는 '초(超)저지연' 환경을 제공한다고 설명했다.

토큰은 AI 모델이 처리하는 데이터의 단위로, 영어 데이터를 기준으로 할 때 일반적으로 단어 하나가 1토큰에 해당한다.

이를 통해 개발자들이 코딩 작업 과정에서 오류를 수정하는 등 작업을 할 때 즉각적인 AI 답변을 받을 수 있어 효율성이 높아질 것으로 추정된다.

오픈AI는 이 모델의 고속 추론 성능을 위해 엔비디아의 그래픽처리장치(GPU) 대신 세레브라스의 '웨이퍼규모엔진3'(WSE-3)을 통해 구동한다고 밝혔다.

엔비디아를 비롯한 대다수 반도체 제조사가 웨이퍼를 잘게 잘라 여러 개의 칩을 만드는 것과 달리 세레브라스는 하나의 웨이퍼를 통째로 사용하는 거대한 칩을 생산한다.

이에 따라 엔비디아의 AI 칩은 메모리 칩과 통신하는 데 시간과 전력을 소모하는 반면, 세레브라스의 칩은 적은 전력을 쓰고 응답 속도도 높일 수 있는 것이 특징이다.

오픈AI는 이번 협력에 대해 "세레브라스와의 파트너십에서 첫 번째 이정표"라고 의미를 부여했다.

다만 오픈AI는 "(엔비디아의) GPU는 여전히 우리의 훈련·추론 작업 전반에 걸쳐 핵심적인 기반"이라며 "세레브라스는 극도로 낮은 지연시간을 요구하는 작업환경에서 탁월한 성능을 발휘해 이 기반을 보완한다"고 부연했다.

오픈AI는 세레브라스에서 750㎿(메가와트) 규모의 연산력을 공급받는 다년 계약을 체결했다고 지난달 14일 발표했다.

미국 언론들은 이달 초 오픈AI가 엔비디아 칩을 이용한 챗GPT 답변에 만족하지 못해 대안을 모색하고 있다고 보도한 바 있다.

오픈AI는 이외에도 미국 반도체 제조사 브로드컴과 협업해 자체 AI 칩을 개발하고 있다.

comma@yna.co.kr

▶제보는 카톡 okjebo

국제