'삼전닉스'가 1000조 투자하는 HBM, 딥시크 논문 한 편의 균열

임선영 2026. 7. 3. 08:07
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[중국AI미래지도] 메모리 병목을 알고리즘으로 해결하다

[임선영 기자]

 중국 양대 메모리 반도체 기업, 양쯔메모리와 창신메모리의 성장과 딥시크의 소프트웨어가 만나면 메모리 반도체 우회 전략을 완성할 수 있다.
ⓒ 자료사진
한국이 대규모 팹 증설을 발표할 때 중국은 조용히 킬러 논문을 발표하였습니다. 삼성전자와 SK하이닉스가 2026년 6월 기준 향후 10년간 1000조 원 규모의 반도체 투자 계획을 발표하고 '왜 호남이냐'라는 공론을 벌일 때 중국의 딥시크(DeepSeek)는 조용히 한 편의 논문을 깃허브에 공개하였습니다.

한쪽은 천조 단위의 하드웨어 투자이고, 다른 한쪽은 오픈소스 논문 한 편입니다. 이는 같은 차원의 경쟁이 아니지만 바로 이 점이 핵심입니다. 중국은 한국이 천문학적 비용을 들여 쌓아 올린 하드웨어 해자를 소프트웨어로 우회하려 하고 있기 때문입니다.

DSpark 논문의 핵심 요약: 메모리 병목을 알고리즘으로 해결하다

DSpark는 추측 디코딩(Speculative Decoding) 프레임워크입니다. 대규모 언어 모델 추론의 병목은 GPU 연산력이 아니라 HBM 대역폭에 있습니다. GPU는 연산보다 HBM에서 데이터를 가져오는 데 더 많은 시간을 소비합니다.

딥시크 팀은 논문에서 하나의 반직관적 발견을 제시하였습니다. 토큰 10개를 디코딩하는 데 드는 HBM 전송 시간은 토큰 1개를 디코딩하는 시간과 거의 차이가 나지 않습니다. 따라서 매번 토큰 1개씩만 전송하면 HBM 대역폭이 대량 낭비된다는 것이 DSpark의 출발점입니다.

DSpark의 핵심은 경량 초안 모델(Draft Model)로 여러 개의 후보 토큰을 빠르게 예측한 뒤, 대형 타깃 모델(Target Model)이 이를 일괄 검증(Batch Verification)하는 방식입니다. 검증을 통과한 토큰은 그대로 수용하고, 실패한 지점에서는 재샘플링(Resampling)을 수행합니다. 이 과정은 수학적으로 출력 품질의 완전 무손실(Mathematically Lossless)을 보장합니다.

DSpark는 반자기회귀(Semi-Autoregressive) 아키텍처를 채택하여 병렬 백본(Parallel Backbone)과 경량 직렬 모듈(Lightweight Serial Module)을 결합함으로써 초안 품질을 확보하였습니다. 여기에 신뢰도 스케줄링(Confidence Scheduling) 검증 메커니즘을 도입하여 시스템 부하에 따라 검증 길이를 동적으로 조정합니다.

실측 데이터는 충격적입니다. DeepSeek-V4-Flash 엔진의 단일 사용자 생성 속도가 60%~85% 향상되었고, 120 tokens/s SLA(Service Level Agreement)의 고부하 환경에서는 유효 처리량(Effective Throughput)이 661% 폭증하였습니다. DeepSeek-V4-Pro 엔진의 경우 50 tokens/s 표준에서 406%의 향상이 확인되었습니다. 더욱 중요한 것은 이 스케줄링 로직이 전적으로 GPU 내부에서 실행되며 CPU 개입이 전혀 필요 없다는 점입니다.

DSpark와 함께 오픈소스화된 딥스펙(DeepSpec) 은 추측 디코딩 초안 모델을 훈련하고 평가하기 위한 풀스택 코드 라이브러리입니다. 이는 이미 깃허브에서 1,400개 스타를 돌파하였으며, Qwen3 등 외부 모델을 전면 지원합니다. 딥시크는 알고리즘, 스케줄링, 하드웨어 적응을 하나로 묶은 종단간(End-to-End) 엔지니어링 완결체를 오픈소스로 내놓은 것입니다.

양쯔메모리(YMTC·长江存储)와 창신메모리(CXMT·长鑫存储): 생산능력 확대와 IPO를 통한 자금 확보

DSpark가 '소프트웨어 기병'이라면, 양쯔메모리와 창신메모리는 점차 완성형에 접근하는 '하드웨어 군대'입니다.

양쯔메모리(YMTC) 는 2026년 5월 19일 상하이 과학기술혁신판(STAR Market, 科创板) 상장을 위한 지도 감사를 정식으로 개시하였으며, 2026 연말 혹은 내년 상반기 상장 예정입니다. 시장은 IPO 기업 가치를 약 3000억 위안(약 68조 4000억 원)으로 전망하고 있습니다. 2026년 1분기 양쯔메모리의 글로벌 낸드플래시(NAND Flash) 시장 점유율은 13%~16% 에 달하여 세계 4위 생산업체로 도약하였습니다. AI 데이터센터의 폭발적 수요에 힘입어 2026년 1분기 매출은 200억 위안(약 4조 5천억원)을 돌파하였습니다.

창신메모리(CXMT) 역시 2026년 상하이 과학기술혁신판 상장을 추진 중이며, 약 295억 위안(약 6조 6000억원)을 조달할 계획입니다. 창신메모리의 DRAM(Dynamic Random Access Memory) 글로벌 시장 점유율은 2026년 1분기 7.7% 로 세계 4위에 올라섰습니다. 더욱 주목할 점은 창신메모리가 텐센트와 5년간 4.5조 원 규모의 D램 장기 공급 계약을 체결하였으며, 알리바바 클라우드, 바이트댄스, 레노버, 샤오미 등 중국 주요 테크 기업들을 고객으로 확보하였다는 사실입니다.

HBM 분야에서 창신메모리는 2026년 말까지 12인치 웨이퍼 기준 월 30만~35만 장 규모의 HBM 생산능력을 확보할 계획이며, HBM3 칩의 대량 생산을 목표로 하고 있습니다. 업계는 중국과 한국의 HBM 기술 격차가 수년 전의 큰 차이에서 현재 약 3년 수준으로 좁혀진 것으로 평가합니다.

셋의 만남: 대체가 아닌 소프트웨어적 우회

기존 내러티브에서 중국 저장 반도체가 삼성전자와 SK하이닉스를 따라잡기 위해서는 수천억 원을 투자하여 팹을 짓고, 미세 공정을 정복하며, 장비 봉쇄를 돌파해야 합니다. 이 길은 적어도 2~3년이 걸립니다.

DSpark는 완전히 다른 경로를 제시합니다. DSpark는 HBM의 용량이나 첨단 공정의 집적도와 겨루지 않습니다. 대신 소프트웨어 스케줄링을 통해 기존 하드웨어의 효율을 극한까지 끌어올립니다. 딥시크 V4라는 1.6조 개의 파라미터를 가진 초거대 모델이 100만 토큰 컨텍스트 환경에서 단 5.48GB의 HBM 메모리만으로 구동될 수 있다는 사실은 이를 단적으로 보여줍니다. 이는 동급 모델 대비 HBM 수요를 90% 이상 압축한 수치입니다.

글로벌 투자은행(IB) 업계 일각에서는 딥시크의 아키텍처가 "고성능 대비 비용(Performance-per-Cost)이 우수한 D램으로 희소한 HBM 자원을 대체한다"는 분석을 내놓고 있습니다. 이는 차세대 AI의 승부처가 더 큰 GPU 클러스터를 단순히 쌓는 것이 아니라 더 스마트한 혼합 아키텍처로 희소한 HBM 자원을 효율적으로 활용하는 데 있음을 시사합니다.

이는 무엇을 의미할까요 같은 HBM 한 장으로 딥시크의 소프트웨어는 3배의 일을 해낸다는 뜻입니다. HBM 생산 능력이 제한되고 가격이 폭등하는 상황에서 중국 기업들은 더 적은 하드웨어로 더 많은 일을 할 수 있게 되었다는 뜻입니다. 중국 저장 반도체 업체들이 HBM의 모든 기술 지표에서 한국을 따라잡을 필요는 없습니다. 소프트웨어 효율이 충분하다면 '충분한' 하드웨어로 '훌륭한' 성과를 낼 수 있기 때문입니다.

이는 대체가 아닙니다. 이는 소프트웨어에 의한 하드웨어 해자의 우회입니다.

글로벌 시장 점유율 확대: D램, 낸드플래시, HBM의 전방위 추격

2026년 1분기 D램 계약 가격은 분기 대비 93%~98% 폭등하였으며, 2분기에는 58~63% 추가 상승이 예상됩니다. HBM3E 가격 역시 2026년 1분기 15%~20% 인상되었습니다. 이 슈퍼사이클에서 중국 업체들은 위치 선점을 가속화하고 있습니다.

카운터포인트(Counterpoint) 데이터에 따르면 2026년 1분기 삼성전자의 D램 점유율은 38%로 여전히 1위를 지키고 있습니다. 그러나 창신메모리의 7.7% 점유율은 이미 무시할 수 없는 수준이며 그 성장 속도는 매우 가파릅니다. 낸드 시장에서 양쯔메모리의 성장은 더욱 폭발적입니다. 점유율이 2025년 1분기 8%에서 2026년 1분기 13%로 급증하며 마이크론 및 샌디스크와 동등한 수준에 도달하였습니다.

DSpark의 효과는 이 추세를 더욱 가속화할 것입니다. 추론 비용이 DSpark로 인해 급감하면 토큰 소비량과 KV 캐시는 기하급수적으로 증가합니다. 고가의 HBM으로는 이처럼 방대한 캐시 데이터를 모두 담을 수 없기에 데이터를 기업용 솔리드 스테이트 드라이브(Enterprise SSD)로 계층적 저장(Tiering) 관리해야 합니다. 이는 곧 양쯔메모리 낸드플래시의 주무대입니다. 추론이 저렴해지고 → 사용량이 폭증하고 → 저장 수요가 폭발하고 → 중국 메모리 업체가 수혜를 본다. 이것이 중국이 최근 구사하는 비즈니스 순환 고리 입니다.

더욱 주목할 점은 글로벌 사우스(Global South) 시장입니다. 중국이 '모델+GPU+메모리' 일체화 솔루션, 즉 딥시크의 모델, 화웨이 GPU, 양쯔메모리와 창신메모리의 메모리를 하나의 패키지로 제공할 수 있다면, 그 가격 대비 성능은 글로벌 사우스 국가들에 막대한 매력으로 다가갈 것입니다. 중국의 전략은 바로 소프트웨어 효율로 하드웨어 성능 격차를 메우고 규모의 경제로 경쟁사를 무력화 하는 것입니다.

한국 메모리 반도체 시장에 미치는 영향: '불가침'에서 '양면 포위'로

삼성전자와 SK하이닉스가 HBM 경쟁에 총력을 쏟는 사이 중국이 범용 메모리 시장을 잠식하고 있습니다. 실제로 글로벌 테크 기업들이 중국산 반도체를 대안으로 고려하기 시작하였다는 보도도 나옵니다. 이제 한국이 직면한 것은 양면 포위 입니다.

고사양 시장에서는 HBM 분야에서 한국이 절대적 우위를 점하고 있지만, 창신메모리는 기술 격차를 약 3년 수준으로 좁혔고, 초고성능 컴퓨터(HPC, High-Performance Computing) '링성(灵晟, Lineshine)'에 중국 최초로 국산 HBM이 탑재되며 실용화 단계에 진입하였습니다. 링성은 2026년 6월 독일 ISC2026 국제초고성능컴퓨팅 학술대회에서 2.19EFlops의 지속 컴퓨팅 성능으로 세계 TOP500 1위에 등극하였습니다.

범용 시장에서는 D램과 낸드플래시 분야에서 중국 업체들의 점유율이 지속적으로 상승하고 있습니다. 양쯔메모리와 창신메모리는 모두 규모화된 흑자 체제에 진입하였습니다.

소프트웨어 측면에서는 DSpark 같은 오픈소스 프레임워크가 AI 시스템의 고급 HBM 의존도를 근본적으로 낮추고 있습니다. 이는 궁극적으로 HBM 수요의 기본 논리 자체를 재고하게 만듭니다.

AI 버블 위험 또한 간과할 수 없습니다. 메모리 가격은 지난 4년간 700%나 치솟았으며, D램과 SSD 가격은 2026년 말까지 130% 추가 상승이 예상됩니다. 그러나 동시에 글로벌 PC 출하량은 10.4%, 스마트폰은 8.4% 감소할 것으로 전망됩니다. IDC는 2026년 글로벌 스마트폰 출하량이 12.9% 감소하며 사상 최대 감소폭을 기록할 것으로 예측하였습니다.

조용한 혁명, 그리고 한국이 직면한 수요의 함정

한국이 천조 단위의 파운드리(Fab) 증설 계획을 발표하였을 때, 딥시크는 깃허브에 한 편의 논문을 공개했습니다. 이는 우연이 아니며 두 가지 상이한 패러다임의 경쟁입니다. 하드웨어 적층 대 소프트웨어 효율, 자본 집약 대 지식 집약의 대결입니다.

그러나 한국 기업들이 가장 주목해야 할 것은 DSpark라는 '기술적 도전' 너머에 있는 '수요의 구조적 변화' 입니다. 골드만삭스는 최근 리포트에서 중국의 저비용 오픈소스 AI 모델이 서구 빅테크의 막대한 AI 인프라 투자에 대한 수익성 의문을 제기하는 핵심 변수로 부상하고 있다고 지적하였습니다. 중국의 GLM-5.2는 Anthropic의 Claude Opus 4.8 대비 특정 작업에서 약 8분의 1 수준의 비용으로 구동되며, OpenAI GPT-5.5(백만 Token당 15달러) 대비 백만 Token당 4.4달러로 약 30% 수준의 비용을 기록하고 있습니다.

이 모델은 화웨이 프로세서 10만 개를 활용하여 학습되었으며, 엔비디아에서 독립하여 충격적입니다. GLM-5.2는 오픈웨이트 모델로 누구나 사용하고 수정할 수 있으며, 중국의 AI 모델은 2023년 미국 선도 모델 대비 약 60% 수준에서 현재 약 90% 수준으로 격차를 좁혔습니다.

이를 반증하듯 코인베이스는 이미 GLM 5.2를 내부 AI 도구의 기본 옵션으로 채택하여 토큰 사용량 증가에도 AI 지출을 거의 절반으로 줄이는 성과를 거두었습니다. 마이크로소프트는 딥시크 적용을 적극 검토 중입니다. 에어비엔비가 이미 작년에 고객 서비스 모델을 GPT에서 Qwen으로 전환한 사례까지 포함하면, 미국 주요 테크 기업들의 중국 AI 모델 도입은 더 이상 특수 사례가 아닌 뚜렷한 구조적 흐름으로 자리 잡고 있습니다.

미중경제안보검토위원회의 3월 보고서는 미국 AI 스타트업의 약 80%가 중국 오픈소스 모델을 사용 중인 것으로 추정했으며, 오픈라우터 통계에도 중국 모델은 2026년 6월 말 기준 45%를 훨씬 상회하는 수준으로 성장한 반면 미국 모델의 점유율은 같은 기간 72%에서 33%로 반토막났습니다.

더욱 심각한 경고는 메모리 반도체 부문에서 나오고 있습니다. 골드만삭스는 메모리 칩과 AI 인프라가 HBM 가격 모멘텀 둔화, 중국 업체의 DRAM 시장 잠식, 미국 AI 서버 투자 전반의 감속이라는 3대 치명적 하방 리스크에 직면해 있다고 경고하였습니다. 이를 단순한 단기 조정이 아닌 구조적 압력으로 규정한 것입니다. 어느 빅테크 기업이라도 AI 지출을 먼저 줄이기 시작하면 AI 섹터 전체의 밸류에이션 논리가 전면적인 재설정에 직면할 수 있습니다.

또 하나 주목할 사건은 애플이 급등하는 메모리 가격에 대응하기 위해 미국 정부에 창신메모리(CXMT)의 D램 구매 승인을 로비하고 있다는 보도입니다. 파이낸셜타임스에 따르면 애플은 이미 한 달여 전부터 미국 상무부 및 트럼프 행정부와 접촉하여 맥 컴퓨터에 CXMT 부품을 사용할 수 있도록 허가를 요청하였습니다. 애플은 최근 맥북과 아이패드 전 제품 가격을 일제히 인상하면서 메모리 가격 상승을 이유로 들었습니다. 애플의 이 같은 로비는 중국산 메모리가 글로벌 공급망의 공식 대안으로 부상할 가능성을 강력히 시사합니다.

이는 한국 메모리 반도체 시장에 대해 하나의 분명한 질문을 던집니다. 삼성전자와 SK하이닉스가 1000조 원을 투자하여 증설한 생산능력을 감당할 글로벌 수요가 정말 존재하는가?

중국의 소프트웨어는 하드웨어 효율을 극대화하여 단위당 HBM 수요를 감소시키고 있고, 중국의 하드웨어는 범용 메모리 시장의 점유율을 빠르게 확대하는 동시에 HBM 양산에 도전하며 글로벌 빅테크들은 AI 투자 대비 수익(ROI)에 대한 의구심 속에 자본지출 효율화를 요구받고 있습니다. 이러한 세 가지 흐름이 겹치는 지점에서 한국의 과감한 설비 증설은 '선제적 우위 확보'가 아닌 '공급 과잉의 덫' 이 될 위험을 내포하고 있습니다.

버블이 꺼지면 과잉 확장된 생산 능력은 가격 폭락의 위험에 직면할 것입니다. 반면 중국 업체들은 원가 경쟁력과 소프트웨어 효율성을 무기로 경기 침체기에 오히려 시장 점유율을 더욱 확대할 가능성이 큽니다.

DSpark는 삼성전자와 SK하이닉스의 공장 가치를 하루 아침에 무너뜨리지 않을 것입니다. 그러나 그것은 조용히 게임의 룰을 바꾸고 있습니다. '연산력'이 더 이상 '칩'만을 의미하지 않고, '메모리'가 더 이상 '용량'만을 의미하지 않으며, 중국 업체들이 더 저렴한 하드웨어와 더 영리한 소프트웨어로 한국의 기업들과 같은 무대에서 경쟁할 수 있게 하고 있습니다.

소프트웨어가 하드웨어의 가치를 정의하기 시작할 때 수천억 원을 들여 지은 공장은 오픈소스 논문 한 편이 가져올 파괴력보다 못할 수도 있습니다. 더욱이 그 공장을 가동할 수요가 논문과 중국의 저비용 AI 모델 공세에 의해 이미 줄어들고 있다면 그 투자는 '미래를 위한 발판'이 아닌 '과거를 위한 기념비'가 될 것입니다. 중국은 엔비디아를 미중 패권 갈등으로 인해 내몰았지만 삼성과 SK하이닉스는 더 무서운 '소트프웨어'와 '가격'으로 내몰 수 있습니다.

[논문 원문]
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

덧붙이는 글 | 임선영 씨는 중국 칭화대 전산언어학 석사를 마친 중국경제전문가이며 <중국경제 미래지도>, <중국AI 미래지도>의 저자입니다. 이 글은 본인의 페북에도 올렸습니다.

Copyright © 오마이뉴스. 무단전재 및 재배포 금지.