“토큰 생성량 폭발, 메모리 장기사이클 2027년 성패 갈릴 것”

이주호 기자 2026. 4. 15. 11:22
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(출처: 제미나이 생성)

AI서비스에 대한 수요가 폭발적으로 늘어나며 반도체 업황의 구조도 바뀌고 있다토큰 생성량은 급증하는데메모리 공급이 따라오지 못하면서 업계는 제한된 메모리 자원으로 더 많은 토큰을 처리하는 방법으로 대응하고 있다이 때문에 고속 작업이 필요한 데이터는 HBM D램이 담당하지만 방대한 콜드 데이터를 저장할 수 있는 낸드플래시가 급부상하고 있다유니스토리자산운용 김장열 본부장은 2027~ 2028년 사이 메모리 수요와 공급의 시차로 일시적인 공급 과잉은 있을 수 있으며 수요의 폭발과 메모리 증설 타이밍이 얼마나 잘 맞느냐에 따라 수년간의 성패가 갈릴 것으로 전망했다

 

AI 서비스의 척도 '토큰'

AI 산업의 성장세를 가늠하는 가장 확실한 지표는 '토큰 생성량'이다오픈AI의 챗GPT, 구글의 제미나이앤스로픽의 클로드 등 주요 거대언어모델(LLM)이 생성하는 토큰 수는 작년 하반기 대비 단기간에 수 배 이상 급증했다.

토큰은 AI가 언어를 이해하고 생성하는 최소 단위다토큰 생성량이 늘어난다는 것은 그만큼 AI 모델이 더 많은 연산을 수행하고 더 방대한 데이터를 처리하고 있음을 의미한다다만토큰의 증가가 곧장 메모리 반도체 구매 수량의 선형적 증가로 이어지는 것은 아니다현재 산업계는 '양자화(Quantization)' 등 기술적 효율화를 통해 제한된 메모리 자원으로 더 많은 토큰을 처리하는 최적화 단계에 머물고 있다그 결과 토큰은 폭증했지만 메모리 물량은 그만큼 늘지 않은 채공급 축소를 배경으로 가격만 두 배 가까이 뛰는 왜곡이 나타났다.

 

낸드, AI 핵심으로 급부상

최근 반도체 업계에서 가장 극적인 반전을 보여주는 대목은 낸드플래시의 부상이다과거 낸드는 단순 저장 장치라는 인식이 강해 AI 열풍에서 다소 소외된 측면이 있었다그러나 AI 추론 과정에서 맥락을 이해하기 위한 '-밸류 캐시(KV Cache)' 용량이 커지면서 상황이 급변했다.

고속 작업이 필요한 데이터는 HBM D램이 담당하지만방대한 데이터를 저비용으로 유지하며 추론 속도를 보조해야 하는 영역에서 낸드의 역할이 재조명된 것이다특히 작년까지만 해도 대규모 적자에 시달리던 낸드 업체들은 감산을 통한 재고 정상화와 AI 서버용 기업용 SSD(eSSD) 수요 폭증에 힘입어 가파른 가격 반등을 맞이하고 있다.

 

향후 제번스의 역설(Jevons Paradox)’이 성패

반도체 업황의 장기 지속성을 결정지을 핵심 고리는 '제번스의 역설(Jevons Paradox)'이다제번스의 역설이란 기술 발전으로 자원 이용의 효율성이 높아져 단위당 소비 비용이 줄어들면오히려 그 자원의 전체 소비량은 급증하게 되는 현상을 말한다.

반도체 업체들이 메모리 효율을 극대화해 AI 서비스의 토큰당 비용을 낮춰주면기업과 개인은 이전보다 더 저렴하게 AI를 이용하게 된다이는 다시 AI 서비스의 대중화와 사용 빈도 증가로 이어져결과적으로 전체 반도체 수요를 더욱 끌어올리는 선순환 구조를 만든다.

다만 시장의 리스크는 공급과 수요의 '시차'에 존재한다현재 메모리 사이클은가격이 먼저물량은 나중이라는 비선형 구간에 있다. 2023~2024년 초 반도체 업체들은 설비투자를 줄이며 공급을 억제했고반면 토큰 기반 AI 수요는 급증했다이 불일치가 HBM·DRAM·낸드 전반의 가격 급등을 만든 국면이지만아직 본격적인 증설은 시작하지 않았다

현재 반도체 기업들이 수익성 개선을 바탕으로 단행하는 설비 투자(CapEx) 물량은 2027년에서 2028년 사이에 시장에 본격적으로 쏟아질 예정이다만약 이 시점에 빅테크 기업들의 자금 조달(Funding) 환경이 악화되거나데이터 센터 가동을 위한 전력 및 인프라 확보에 차질이 생길 경우 일시적인 공급 과잉 구간에 진입할 위험이 있다.

관건은 제번스의 역설로 인해 AI 서비스 수요가 폭발하는 시점과 메모리 증설 타이밍이 얼마나 잘 맞느냐다. 증설이 너무 빨라 제번스 효과 이전에 공급이 쏟아지면 가격 붕괴·업황 악화가 불가피하고반대로 제번스 효과가 먼저 터지면 단기적인 공급 부족·가격 급등이 반복된다.

이 시점과 맞물려유가 상승에 의한 인플레이션으로 금리가 인상될 경우 AI 스타트업과 일부 적자 데이터센터 프로젝트의 자금 조달에 문제가 발생할 가능성이 있다또 이미 지어지고 있는 데이터센터들이 전력인프라에너지 부족으로 설비는 있으나 충분히 가동하지 못하는 언더유틸라이제이션 가능성도 있다

AI 토큰의 급증은 AI 서비스에 대한 폭발적인 수요 증가를 증명한다이로 인해 낸드 수요 확장이라는 구조적 변화도 나타나고 있다다만, 2027년 메모리 공급이 늘어나는 시점과 제번스의 역설이 얼마나 정교하게 맞물리느냐에 따라 향후 수년간의 성패를 가를 것으로 전망된다

 

#반도체 #AI반도체 #메모리업황 #낸드플래시 #D #토큰 #KV캐시 #HBF #SSD #eSSD #제번스의역설 #HBM #빅테크 #데이터센터 #반도체전망 #AI인프라 #삼성전자 #SK하이닉스 #설비투자

 

<편집자주

해당 기사는 삼프로TV 인터뷰 방송을 정리한 내용입니다더욱 정확한 풍성한 내용은 방송을 확인하시기 바랍니다.