퓨리오사AI, 2세대 NPU '레니게이드' 공개…추론시장 정조준

백준호 퓨리오사AI 대표가 2세대 NPU칩 레니게이드를 서울 강남 SJ쿤스트할레에서 2일 전격 공개했다. /사진=국정근 기자

인공지능(AI) 반도체 설계 스타트업 퓨리오사AI가 2세대 신경망처리장치(NPU) '레니게이드(RNGD)'를 서울 강남구 SJ쿤스트할레에서 2일 공개했다. AI 추론 시장을 겨냥한 제품으로 비용 효율성을 핵심 경쟁력으로 내세웠다.

백준호 퓨리오사AI 대표는 AI 데이터센터의 투자 흐름이 훈련에서 추론 중심으로 빠르게 재편되고 있다고 진단했다. 그는 "그래픽처리장치(GPU) 30만장 도입 등 현재 전 세계적으로 약 1기가와트(GW) 규모, 40조~50조원의 증설 비용이 투입되고 있다"며 "이 기조는 2030년까지 전력 공급량이 100GW 수준으로 늘어나고, 이 중 70%를 추론용에 할당하는 식으로 확장할 것"이라고 답했다.

현재 AI 서비스 기업들은 막대한 AI 인프라 비용을 감수하며 적자 운영 중이다. 백 대표는 컴퓨팅 비용 효율화가 AI 반도체 설계 기업들의 핵심 과제라고 짚으며, 레니게이드가 그 해법이 될 수 있다고 강조했다.

레니게이드는 2021년 기획을 시작해 2022년 실리콘 개발에 착수했다. 올해 1월 양산을 개시했으며 연내 2만장 규모의 공급 채비를 마련했다. 400억개의 트랜지스터와 4세대 HBM3를 2.5D 인터포저 패키징으로 구현했고, 레니게이드 서버는 4페타플롭스(petaFLOPS) 환경에서 구동된다.

이날 발표한 벤치마크에서 레니게이드는 'LG 엑사원 4.0 32B' 모델 기준 처리량(쓰로풋) 1만2342개를 기록했다. 전력 소모는 120와트(W)대로, 비교군인 RTX Pro(600W) 대비 5분의1 수준이다. 동급 성능에서 전력 효율이 높은 수치다.

백 대표는 "주어진 전력 내에서 더 많은 토큰을 생성하는 것이 칩 경쟁력의 핵심"이라며 "퓨리오사AI는 다양한 AI 모델을 지원하는 소프트웨어 스택을 기반으로, 작년 LG AI연구원 공급을 넘어 올해 고객사를 더욱 넓혀갈 것"이라고 답했다.

국정근 기자

기사원문보기