[강현철의 뉴스 솎아내기] 무서운 中의 AI반도체 국산화

강현철 논설실장

중국의 ‘인공지능(AI) 굴기’가 무섭다. 연초 대규모언어모델(LLM)에서 ‘딥시크(DeepSeek) 쇼크’로 세계를 충격에 빠뜨리더니 ‘AI+’(AI 플러스) 정책을 통해 AI의 산업과 실생활 적용을 가속화하고 있다. 그리고 이번엔 ‘AI 반도체’의 국산화마저 선언해 세계를 놀라게 만들고 있다. 중국 내 AI 생태계 자립이 예상보다 빠르게 실현되고 있는 것이다.

메리츠증권에 따르면 딥시크는 지난달 8월 공개한 ‘V3.1’ 최신 모델에서 ‘UE8M0 FP8’ 스케일을 공식 채택한다고 밝히면서 이 모델은 ‘차세대 국산 칩과도 호환된다’는 메시지를 내놓았다. ‘FP8’ 형식은 미국 엔비디아가 주도하는 글로벌 기업들이 사용하는 AI 추론의 국제 산업표준이다. 메모리 반도체를 절감하고, 성능 효율은 최적화하는 장점을 갖고 있다.

다만 딥시크의 ‘UE8M0 FP8’은 변형된 포맷으로, 중국 국산 칩이 당장 글로벌 FP8 표준을 완벽하게 지원하지 못하는 한계를 메우는 전략으로 볼 수 있다. 현지 보도에 따르면 딥시크의 ‘R2’ 차기 모델이 화웨이의 AI 칩인 어센드(Ascend)를 탑재, 성능 테스트 중인 것으로 전해진다. 딥시크가 단순 LLM 모델을 넘어 중국 AI 산업의 자립 과정에서 소프트웨어로 로컬 하드웨어의 단점을 보완하며, 산업의 핵심 파트너로 생태계에 기여하려는 전략적 움직임으로 해석된다. 지난해 12월 오픈소스 형태로 ‘V3’ 모델을 출시한 딥시크는 지난 1월 ‘R1 추론 모델’, 5월 ‘R1 업데이트’, 8월 ‘V3.1’을 출시한 상태다.

이런 상황에서 알리바바가 AI칩의 자체 개발 및 자국 생산을 추진하고 있다. 미 월스트리트 저널(WSJ)은 최근 알리바바가 차세대 AI 칩을 개발 중이며, 이미 테스트 단계에 있다고 보도했다. 또한 대만 TSMC가 아닌 로컬 파운드리를 통해 생산할 계획이라고 전했다.

이에 대해 알리바바 측은 노코멘트했지만 지난 8월 29일 1분기 실적 컨퍼런스에서 최고경영자(CEO)가 AI칩 조달에 플랜B를 갖고 있다고 밝혀, 반도체 국산화 전략을 시사했다. 알리바바는 향후 3년간 AI 분야에 3800억 위안(약 74조원)을 투자할 계획이다.

이런 흐름은 미국의 기술 제재에 맞서기 위한 중국 정부의 국산대체 정책이 중요한 촉매제로 작용했다. 지난 7월말 중국 정책당국은 엔비디아가 공급하는 ‘H20 칩’에 백도어 위험이 있다고 지적하면서 중국 기업들의 신중한 구매를 요구했다. 사실상 많은 기업들의 사용에 제한을 둔 조치인 셈이다. 이에 엔비디아는 ‘B30A 칩’으로 대체하는 방안을 추진 중이지만, 미중 양국 정책당국의 심의를 거쳐야 하는 상황으로 여전히 불확실성이 높다.

중국 정부는 국산 AI 반도체의 구매를 유도하고 있다. 대표적인 조치는 공공 데이터센터들의 컴퓨팅 칩의 절반 이상을 중국 업체로부터 공급 받도록 요청하는 것이다. 특히 베이징과 상하이는 2027년까지 데이터센터의 컴퓨팅과 스토리지 칩 국산 채택률 70%를 넘기는 목표를 제시하고 있다. 이에 따라 중국 내에서 다양한 엔비디아 대체 칩들이 출현하고 있다.

화웨이의 ‘어센드’(Ascend)는 엔비디아 칩을 대체할 수 있는 가장 강력한 제품으로 꼽힌다. 화웨이는 어센드 시리즈를 데이터센터용 그래픽 처리장치(GPU) 대안으로 제시하고 있다. 최신 모델인 ‘어센드 910C’는 엔비디아 ‘A100’보다 2.5배 높은 성능을 나타내고 있다. 화웨이는 단일 AI칩 성능의 단점을 극복하기 위해 어센드 칩 클러스터화를 통해 엔비디아 추월을 시도 중이다.

대표적인 제품은 올해 세계인공지능대회에서 선보인 ‘Atlas 900 A3 SuperPoD’ (일명 CloudMatrix 384 AI 슈퍼클러스터)다. 384개의 어센드 910c NPU를 버스 구조로 연결하여 클러스터 내 컴퓨팅, 저장 장치, 메모리 간의 통신 병목을 해소해 마치 하나의 대형 컴퓨터처럼 작동하도록 시스템 수준에서 최적화했다.

캠브리콘의 ‘MLU 370/590’ 칩이 그 뒤를 잇는다. 캠브리콘은 초기에 추론 칩에서 시작했지만, ‘MLU370’ 시리즈 통해 클라우드 AI 학습 시장에 본격적으로 진출하기 시작했다. ‘MLU590’은 엔비디아의 ‘A100’ 대체급으로 내놓은 제품이며 ‘A100’ 성능의 약 80%에 달하는 것으로 평가되고 있다. 내년에는 590의 상위 버전인 ‘MLU690’ 라인업까지 발표하며 고성능 컴퓨팅(HPC) 시장을 본격 겨냥하고 있다.

바이두의 ‘쿤룬’(Kunlun) 칩은 중에서 추론 및 학습용 칩을 겨냥하고 있다. 바이두는 2021년부터 2세대 칩 양산을 시작했다. 연산 속도나 정밀도는 엔비디아의 ‘A100’ 대비 약 40% 낮은 것으로 평가되고 있지만, 중국 내 자국산 칩 수요 정책 덕분에 활용도가 빠르게 늘어나고 있다. 바이두는 이를 자율주행, 클라우드 검색 등 서비스에 실제 적용하고 있다. 또한 화웨이처럼 바이두도 ‘쿤룬2’를 기반으로 만들어진 ‘P800’ 칩 3만개를 클러스터화 함으로써 전체 시스템의 성능을 개선하고 있다.

이밖에 Biren Tech, Moore Threads, Muxi 등 다양한 AI칩 스타트업들도 빠르게 발전하고 있다. 이중 가장 강력한 칩은 Biren의 ‘BR100’이다. Biren은 2019년에 상하이에 설립된 팹리스 반도체 스타트업이며 센스타임(SenseTime), 퀄컴(Qualcomm), 화웨이(Huawe)i 출신 인사들이 참여하고 있다. ‘BR100’은 첫번째 범용 GPU 제품으로 AI 데이터센터 컴퓨팅을 겨냥한 고성능 칩이다. 회사에 따르면 ‘BR100’은 딥러닝 워크로드에서 ‘A100’보다 약 2.6배 빠른 처리 속도를 보인다.

중국은 아직까진 엔비디아에 미치지 못하는 성능을 클러스터화를 통한 시스템 성능 개선과 딥시크 등 소프트웨어와 하드웨어와의 통합을 통한 전략적 솔루션을 시도하고 있다. 하지만 성능이 떨어지더라도 정책당국이 적극적인 사용을 추진하고 있어 중국 내 국산 대체 속도가 빠르게 이루어질 가능성이 높다.

올해 중국의 파운드리 생산능력은 3배 확대된다. 파이낸셜 타임스의 보도에 따르면 올해 말부터 화웨이를 위한 전용 AI 파운더리 공장이 가동을 시작할 예정이며, 내년에는 두 곳이 추가 가동될 전망이다. SMIC는 2026년에 7나노(nm) 생산능력을 현재의 두배 수준으로 확대할 계획이다. 여기에 중국의 대표 메모리 기업인 CXMT도 SK하이닉스, 마이크론, 삼성 등이 장악한 고대역폭메모리(HBM) 시장에 도전해 내년 HBM3 출시를 목표로 하고 있는 것으로 현지 언론이 전했다.

최설아 메리츠증권 연구원은 “중국의 AI 칩은 아직까진 엔비디아의 고성능 칩을 대체할 수 있는 수준이 아니다”며 “하지만 정책당국의 지원에 힘입어 국산 대체 속도가 빠르게 이뤄질 가능성이 높다”고 말했다.

강현철 논설실장

디지털타임스

사설칼럼

[강현철의 뉴스 솎아내기] 무서운 中의 AI반도체 국산화