퓨리오사AI, 차세대칩 '레니게이드' 공개…엔비디아칩 2배 전력 효율

고석용 기자 2024. 4. 26. 16:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

레니게이드는 가로, 세로 각 5.5cm 크기에 400억개 이상의 트랜지스터가 집적돼 있다.

백준호 퓨리오사AI 대표는 "챗GPT가 출시되기 전 선제적으로 HBM3를 탑재한 고성능 AI 반도체 개발에 착수한 후 TSMC는 물론 디자인하우스인 GUC 등 글로벌 파트너사들과의 협업해 레니게이드를 완성할 수 있었다"며 "시기적으로도 추론용 AI반도체 수요가 급증하는 시점인 만큼, 시장 기회를 선점할 수 있도록 하겠다"고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

서버향 AI 반도체(NPU)를 개발하는 퓨리오사AI가 미국 산타클라라 컨벤션센터에서 열린 TSMC 기술 심포지엄에서 2세대 칩인 '레니게이드(RNGD)' 실물을 공개했다고 26일 밝혔다.

레니게이드는 가로, 세로 각 5.5cm 크기에 400억개 이상의 트랜지스터가 집적돼 있다. AI반도체 최초로 SK하이닉스에서 HBM3를 공급받아 탑재한 것이 특징이다. 이를 통해 메모리대역폭을 넓혀 초거대언어모델(LLM) 추론에서 높은 성능을 보여줄 것으로 보인다. TSMC의 5나노 공정으로 생산됐다.

레니게이드는 엔비디아가 지난해 출시한 중급 AI반도체인 L40S와 경쟁할 것으로 전망된다. 연산능력(FLOPS)은 L40S가 733테라플롭스로 레니게이드(512테라플롭스)보다 높지만, 메모리대역폭은 레니게이드가 1.5TB/s로 L40S(0.86TB/s)보다 높다.

성능에선 유사하지만, 전력소모량은 레니게이드가 150W로 L40S 350W보다 2배 이상 효율적이다. L40S가 델테크놀로지스, 휴렛팩커드엔터프라이즈, 레노버 등 글로벌 기업들의 서버들이 채택하고 있는만큼 거대한 시장이다. 퓨리오사AI와 함께 국내 AI칩 빅3 팹리스로 평가받는 사피온이 지난해 11월 발표한 X330도 L40S를 겨냥해 개발됐다.

퓨리오사AI의 레니게이드(RNGD)와 엔비디아 L40S, H100과의 성능 비교. 대부분 스펙이 L40S를 겨냥한 것으로 보인다. L40S보다 TFLOPS는 낮지만 메모리대역폭(Bandwidth)이 2배 가량 높으며 전력소비량도 2배 이상 효율적이다. /이미지=퓨리오사AI


퓨리오사AI는 하반기부터 고객사에게 레니게이드 샘플을 제공하는 등 본격적인 판로를 확보해간다는 계획이다.

백준호 퓨리오사AI 대표는 "챗GPT가 출시되기 전 선제적으로 HBM3를 탑재한 고성능 AI 반도체 개발에 착수한 후 TSMC는 물론 디자인하우스인 GUC 등 글로벌 파트너사들과의 협업해 레니게이드를 완성할 수 있었다"며 "시기적으로도 추론용 AI반도체 수요가 급증하는 시점인 만큼, 시장 기회를 선점할 수 있도록 하겠다"고 밝혔다.

[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]

고석용 기자 gohsyng@mt.co.kr

Copyright © 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?