생성형 AI 4개 한 번에 작동…사피온, AI 반도체 X330 공개

배한님 기자 2023. 11. 16. 13:00
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

SK그룹의 IT계열사(SK텔레콤·SK하이닉스·SK스퀘어)들이 투자한 반도체 팹리스(설계 전문) 스타트업 '사피온'이 초거대 AI(인공지능)의 '두뇌', AI 반도체 신제품을 공개했다.

사피온은 16일 서울 강남구 코엑스에서 열린 SK 테크 서밋에서 데이터센터용 AI 반도체 'X330'을 공개했다.

국내 최초 데이터센터 전용 AI 반도체였던 전작 X220 이후 3년 만에 나온 신제품이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

데이터센터 전용 AI칩…전작 대비 연산 4배·전력 효율 2배↑
내년 하반기 본격 양산 전망…"2025년부터 의미 있는 매출 나올 것"
류수정 사피온 대표가 지난 15일 서울 중구 SKT타워에서 열린 사전 간담회에서 AI반도체 신제품 X330을 선보이고 있다. /사진=배한님 기자


SK그룹의 IT계열사(SK텔레콤·SK하이닉스·SK스퀘어)들이 투자한 반도체 팹리스(설계 전문) 스타트업 '사피온'이 초거대 AI(인공지능)의 '두뇌', AI 반도체 신제품을 공개했다. 데이터센터 전용으로 개발된 해당 제품은 전작 대비 연산 성능을 4배 끌어올리고 전력 소모는 절반 수준으로 줄였다. 올해 여름 출시된 엔비디아의 제품보다 연산 성능이 2배 높다. 생성형 AI 시대 도래로 2027년까지 CAGR(연평균 성장률) 31%를 바라보는 데이터센터 전용 AI 반도체 시장을 정조준하는 것이다.

사피온은 16일 서울 강남구 코엑스에서 열린 SK 테크 서밋에서 데이터센터용 AI 반도체 'X330'을 공개했다. 국내 최초 데이터센터 전용 AI 반도체였던 전작 X220 이후 3년 만에 나온 신제품이다. 세계 최대 파운드리 업체인 대만 TSMC의 7㎚ 공정을 통해 생산된 제품이다. 반도체 내부에 사용된 GDDR(그래픽카드)은 모두 SK하이닉스 D램 제품을 사용하고 있다.

추론용 NPU(신경망처리장치)인 X330은 전작인 X220보다 연산 성능이 4배 이상, 전력효율이 2배 이상 높다. NPU는 딥러닝 등 AI 인공신경망 알고리즘에 쓰이는 연산 처리에 최적화한 반도체다. 일반적으로 초거대 AI에 사용되는 AI 반도체인 GPU(그래픽처리장치)보다 범용성은 떨어지지만, 알고리즘 연산 능력은 약 10배 높은 것으로 알려졌다.

X330은 LLM(초거대 언어모델) 구동도 직접 지원한다. 사피온은 X330 시연에서 메타(구 페이스북)의 LLM 라마2(LLaMA2) 모델 4개를 한 번에 구동시켰다. 챗GPT와 같은 초거대 AI 모델 4개를 AI 칩 한 개로 돌릴 수 있다는 의미다.

X330은 AI '학습'보다 '추론'에 집중한 모델이다. AI 학습과 추론 양쪽에서 활용할 수 있는 GPU는 글로벌 기업인 엔비디아가 전 세계 시장 80% 이상을 차지하고 있다. 이에 GPU보다 NPU를 만들어 선택과 집중을 하기로 한 것이다.

마이클 쉐바노우 사피온 CTO(최고기술책임자)는 "사피온은 엔비디아와 비교하면 엄청나게 작은 기업이기 때문에, 이들과 직접 경쟁하기보다 추론 한쪽에 집중하는 전략을 택했다"고 설명했다. 류수정 사피온 대표도 "내부 테스트 결과 엔비디아 5㎚ 공정 제품 L40S 보다 연산 성능은 약 2배, 전력 효율은 1.3배 우수한 수준"이라고 강조했다.

사피온은 최적화 등 시제품 테스트를 진행하고 주요 고객사와 신뢰성을 검증한 후 내년 상반기부터 X330 양산을 시작한다. SK텔레콤의 IDC(인터넷데이터센터)·NHN클라우드·MBC 등 X220이 쌓은 다양한 레퍼런스를 바탕으로 X330 고객을 유치할 계획이다.

류 대표는 "일반적으로 (AI 반도체) 제품이 나와 본격적으로 양산되는 시기는 1년에서 1년 반이 걸린다"며 "의미 있는 규모의 매출은 2025년부터 나올 전망"이라고 설명했다. 류 대표는 이어 "글로벌 데이터센터로 고객사를 확대할 수 있도록 논의를 많이 하고 있다"며 "현재 해외 탑 통신사·방송사와 PoC(신기술 사전 검증)을 진행하고 있고, 대형 SI(시스템 구축 기업)와 공동 프로모션이나 판매 유통을 논의하고 있다"고 했다.

배한님 기자 bhn25@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?