사피온, 4배 빨라진 데이터센터용 AI 반도체 'X330' 출시

이나리 기자 2023. 11. 16. 13:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

추론용 AI 반도체, TSMC 7나노 공정 생산…엔비디아 L40S GPU와 경쟁

(지디넷코리아=이나리 기자)AI 반도체 기업 사피온(SAPEON)이 전작 보다 4배 빨라진 차세대 데이터센터용 AI 반도체 'X330'을 3년 만에 출시한다. 그동안 국내서 여러 응용사례를 만들어 낸 사피온은 이번 차세대 칩 X330으로 글로벌 데이터센서 시장 진출을 확대할 것으로 기대된다.

사피온은 16일 코엑스에서 진행되는 'SK 서밋' 행사에서 X330 공식 발표에 앞서 15일 오후 SKT타워에서 기자간담회를 갖고 신제품 소개와 함께 사업 전략을 발표했다.

류수정 사피온 대표가 차세대 AI 반도체 'X330'을 소개하는 모습.(사진-사피온)

2022년 SK텔레콤에서 분사한 AI반도체 팹리스 기업으로, SK ICT 연합 3사(SK텔레콤, SK하이닉스, SK스퀘어)가 공동 투자해 출범했다. 사피온은 2020년 국내 최초로 데이터센터용 AI 반도체 X220(28 나노, TSMC 생산)을 양산했으며, 자동차, 보안, 미디어 등 다양한 분야로 상용 서비스 분야들을 지속적으로 확대하고 있다. X220이 공급된 고객사는 NHN클라우드, SK텔레콤 NPU 팜, MBC(방송국). 하나금융 등이 대표적이다.

차세대 AI 반도체 X330은 TSMC의 7나노공정을 통해 생산된 제품으로 추론용 NPU 시장을 공략한다. X330은 기존 X220 대비 4배 이상의 연산 성능, 2배 이상의 전력효율을 확보했다. 사피온에 따르면 X330은 올해 출시된 경쟁사의 5나노 제품 대비 연산 성능은 약 2배, 전력 효율은 1.3배이상 높다고 설명한다. 또 엔비디아 L40S GPU를 대체할 수 있는 칩이라고 소개했다. 

기존 X220은 고성능 AI 언어 모델(Language Model)인 ‘BERT’ 추론 성능을 지원했다면, 새로운 X330은 대화형 AI '챗GPT'의 원천기술인 '트랜스포머(Transformer)' 기반 대규모언어모델(LLM, Large Language Model) 지원을 추가했다는 점이 특징이다.

X330은 기존 X220 대비 4배 이상의 연산 성능, 2배 이상의 전력효율을 확보했다.(사진=사피온)

류수정 사피온 대표는 "X220의 장점을 극대화한 X330로 AI서비스 모델 개발 기업, 데이터 센터 시장 공략에 박차를 가할 전략"이라며 "산업 전 분야에서 AI 반도체 활용도를 높여 고도의 AI 기술을 누구나 저렴하게 이용할 수 있게 제공함으로써, 모두가 첨단 기술 발전의 혜택을 향유할 수 있는 사회를 만드는데 공헌하고자 한다"고 말했다.

이어 류 대표는 "현재 주요 고객사들을 대상으로 X330 시제품 테스트와 신뢰성 검증(POC) 작업을 진행 중이고, 내년 상반기부터 양산을 시작할 예정"이라며 "X330은 POC로 인해 빠르면 연말부터 작은 매출이 발생하고, 카드 비즈니스를 시작하면 내년 상반기에 매출이 시작될 것으로 본다. SK텔레콤에 있는 서비스들을 NPU로 전환하고 있기 때문에 이 파이프라인이 더 확대될 것으로 기대한다"고 덧붙였다.

X330은 칩 뿐 아니라 2가지 종류의 카드, 서버 시스템으로도 공급된다. 카드는 컴팩트(367 테라 FLOPS 성능), 프라임(734테라 FLOPS) 2종이다. 

X330 프라임 카드 스펙(사진=지디넷코리아)

X330은 동영상 관련 프로그램의 처리속도 향상을 위해 비디오 코덱(Video codec), 비디오 후처리(video post processing) 설계자산(IP)를 내장하고 있다. X330은 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다. X330 메모리 부분에는 SK하이닉스의 16GB GDDR6 가 탑재됐다.

사피온은 개발자 친화적인 '제로 터치 SDK'를 강조했다. 고객이 X330를 네트워크에 배포하는 시간을 최소화한다는 방침이다. 이를 위해 사피온은 ONNX(개방형 신경망 교환, Open Neural Network Exchange) 기반의 소프트웨어 스택을 지원하며, AI 추론 플랫폼 소프트웨어 및 SDK(소프트웨어 개발 도구)도 함께 제공한다.

사피온은 후속 제품으로 2025년 말 또는 2026년 출시를 목표로 X440도 개발 중이라고 밝혔다. X440은 사피온 칩 중에서 처음으로 고대역폭메모리(HBM)3 이상급 메모리가 탑재된다는 점이 특징이다. HBM에서도 SK하이닉스와 협력한다. 또 자율주행 자동차용 IP(반도체 설계자산), CCTV 등 고성능 엣지 디바이스용 AI NPU 도 선보일 계획이다.

마이클 쉐바노우 사피온 CTO가 AI 반도체 'X330' 성능을 소개하고 있다.(사진=사피온)

한편, 이날 간담회에는 지난 6월 사피온에 합류한 마이클 쉐바노우 CTO가 공식 행사에 처음으로 참석해 주목받았다. 그는 엔비디아, AMD, 삼성전자, 케이던스 등에서 근무한 35년 경력의 고성능 컴퓨팅 설계 전문가로 엔비디아 1세대 쿠다를 개발하기도 했다. 

마이클 CTO는 "사피온은 추론용 NPU를 잘 만드는 기업"이라며 "하드웨어뿐 아니라 소프트웨어에서도 혁신적인 제품 개발을 통해 글로벌 경쟁력을 높이겠다"고 전했다. 

이나리 기자(narilee@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?