[HBM 수요 축소 가능성에 삼성전자·하이닉스 주가 급락] 반도체 쇼크 안긴 구글 논문… 터보퀀트 기술 효과 엇갈린 시각

구글이 공개한 새로운 압축 기술, ‘터보퀀트(TurboQuant)’에 대한 논문은 메모리 사용량을 현저히 줄여 고용량 고대역폭 메모리(HBM) 수요를 줄일 수 있다는 가능성을 제시했다. 이는 HBM을 앞세워 유례없는 호황을 누리던 반도체 기업에 투자한 투자자의 공포 심리를 자극했다.

삼성전자·SK하이닉스·마이크론 등 글로벌 반도체 기업이 구글발(發) ‘논문 한 편’에 하루 새 주가가 폭락하는 사태가 빚어졌다. 구글이 공개한 새로운 압축 기술, ‘터보퀀트(TurboQuant)’에 대한 논문은 메모리 사용량을 현저히 줄여 고용량 고대역폭 메모리(HBM) 수요를 줄일 수 있다는 가능성을 제시했다. 이는 HBM을 앞세워 유례없는 호황을 누리던 반도체 기업에 투자한 투자자의 공포 심리를 자극했다. 하드웨어의 한계를 소프트웨어로 극복하겠다는 구글의 선언에 삼성전자와 SK하이닉스의 주가가 휘청였으나, 일각에서는 이를 오히려 HBM 수요 증가의 기회로 보는 엇갈린 해석도 나온다.

구글이 주장한 터보퀀트… “메모리 적게 쓰고 처리 속도는 높인다”

사건 발단은 구글 딥마인드 연구진이 3월 24일(이하 현지시각) 발표한 터보퀀트 기술 논문이다. 이 기술의 핵심은 인공지능(AI) 모델 연산 과정에서 데이터의 정밀도를 낮추면서도 성능 하락을 최소화하는 ‘양자화(quantization) 및 압축 기술’이다.

기존 AI 모델은 방대한 파라미터를 저장하기 위해 막대한 양의 HBM이 필요했다. 하지만 구글은 논문에서 메모리 반도체(이하 메모리) 사용량을 최대 여섯 배 줄이면서도 연산 처리 속도는 최대 여덟 배 높일 수 있는 최적화 공식을 구현했다고 설명했다. 터보퀀트는 연산 시 참조하는 데이터 정밀도를 최적화해 병목현상을 제거하고, 답변 속도를 극대화하는 기술이다. 대화 맥락을 기억하는 메모리 데이터인 ‘KV캐시’ 용량을 압축해 AI가 복잡하고 긴 질문에도 빠르고 정확하게 답을 찾을 수 있게 된다는 것이다. 쉽게 말해, 고화질 영화(4K)를 화질 저하가 거의 느껴지지 않는 수준의 일반 HD급으로 압축하는 것과 같다. 용량이 줄어드니 전송 속도는 빨라지고 메모리 저장고에 여유 공간이 생겨 고용량 HBM의 필요성이 줄어든다는 논리다.

시총 수십조 증발… 삼성전자·SK하이닉스에 닥친 반도체 쇼크

이 논문이 공개되자마자 시장은 즉각 반응했다. 엔비디아를 비롯해 메모리 의존도가 높은 하드웨어 기업의 ‘공급과잉’ 우려가 번진 것이다. 그간 AI 붐이 일어나면서 대용량의 연산 작업을 위해 더 많은 메모리가 필요해졌고, 이는 HBM 등 고가의 고성능 메모리 수요 증가로 이어졌다. 하지만 터보퀀트 기술로 AI가 메모리를 덜 쓰게 되면 더 이상 고가의 메모리를 대량 구매하지 않아도 된다는 생각에 ‘앞으로는 비싼 메모리를 많이 살 필요가 없다’는 시그널로 읽힌 것이다. 이같은 생각이 확산하며 고성능 메모리 판매로 막대한 이익을 거두던 반도체 기업의 주가 하방 압력으로 작용했다.

논문 발표 직후 뉴욕 증시와 한국 증시는 요동쳤다. 특히 HBM 시장에서 앞서나가는 선두 주자 격인 SK하이닉스와 추격에 속도를 내던 삼성전자 주가가 직격탄을 맞았다. 블룸버그 등 외신에 따르면, 논문 발표 후 SK하이닉스와 삼성전자 주가는 최소 6% 이상, 마이크론과 샌디스크 주가는 최소 7% 이상 하락했다. 구글 논문 발표 후 3일간 삼성전자와 SK하이닉스의 시총은 20조원 넘게 증발한 것으로 집계됐다.

삼성전자 주가는 5일 연속, SK하이닉스 주가는 4일 연속 각각 하락하다, 4월 1일 반등했다. 이는 도널드 트럼프 미국 대통령이 3월 31일 백악관 행정명령 서명식에서 “곧 이란에서 아주 철수할 예정”이라고 말하고, 마수드 페제시키안 이란 대통령 역시 “추가 공격이 없다는 보장이 있다면 전쟁을 끝낼 준비가 돼 있다”며 종전 의사를 밝히며 커진 전쟁종전 기대감이 반영된 것으로 풀이된다.

제번스의 역설’… 효율 높아지면 수요는 더 폭발할 수도

그러나 터보퀀트의 등장은 HBM 수요 감소 같은 비관론만 낳은 게 아니다. 기술 진보로 자원 이용의 효율성이 높아지면 오히려 그 자원의 전체 소비량이 늘어나는 현상을 말하는 ‘제번스의 역설(Jevons Paradox)’이 반도체 시장에서도 재현될 것이라는 관측이 나왔다. 영국 경제학자 윌리엄 스탠리 제번스는 제임스 와트가 개량한 증기기관이 석탄 사용 효율을 높였음에도 불구하고 오히려 석탄 소비를 줄인 게 아니라, 되레 석탄 수요를 크게 늘린 현상을 ‘역설’이라고 해석했다.

구글의 터보퀀트 기술로 AI 구동 비용이 적어지면, 그동안 비용 부담 때문에 AI 도입을 망설였던 스마트폰·가전·자동차 기업이 앞다투어 AI를 탑재하게 된다. 결국 ‘기기당 메모리 용량’은 줄어들 수 있어도 ‘AI 기기 총량’이 늘어나면서 전체 메모리 수요는 우상향할 것이라는 분석이다.

숀 킴 모건스탠리 애널리스트는 보고서에서 핵심 병목현상을 해소하기 때문에 긍정적일 것으로 봤다. 그는 터보퀀트로 인해 성능저하 없이 낮은 용량 메모리로 실행이 가능하다면, AI 모델 배포가 용이해지고 수요가 늘어나 수익성이 높아질 것이라고 분석했다. 앤드루 잭슨 오터스어드바이저스 애널리스트는 “극심한 (메모리) 공급 제약 상황을 고려할 때 터보퀀트 기술이 수요에 미치는 영향은 미미할 것”이라고 평가했다.

Plus Point
구글 터보퀀트 핵심 기술 연구 참여 유일 韓 과학자
한인수 카이스트 교수 “AI 모델 즉시 적용 가능”

한인수 카이스트 교수 - 카이스트 전기 및 전자공학부 학·석·박사, 미국 예일대 박사 후 연구원 /카이스트

구글 터보퀀트 핵심 기술 연구에 참여한 한인수(34) 카이스트 전기및전자공학부 교수는 “현재 AI 모델에 즉시 적용 가능하다”고 밝혔다. 3월 30일 온라인 기자 간담회에서 기술 상용화 가능성에 이같이 답한 그는 “필요 없는 정보량을 좀 덜어내는 방법으로, 적은 메모리로도 고성능 AI 모델을 충분히 돌릴 수 있다”고 주장했다.

한 교수는 엔비디아 그래픽처리장치(GPU)인 H100 환경에서 터보퀀트를 적용했을 때 기존 대비 연산 속도가 최대 여덟 배까지 빨라지는 게 실험으로 확인됐다고 설명했다. 이어 터보퀀트 기술을 “범용 벡터 기반 검색 최적화에도 활용할 수 있다”며 “터보퀀트가 메모리 확보나 네트워크 연결이 제한된 상황에서 쓰이는 온디바이스 AI 진입 장벽을 낮추고 군사 관련 기술에도 큰 영향을 미칠 것이라고 생각한다”고 했다. 다만 그는 “터보퀀트라는 알고리즘 하나가 세계 하드웨어 시장에 큰 영향을 주리라고는 예상을 못 했다”며 “소프트웨어와 하드웨어가 함께 최적화해야 실제 AI 효율에 기여할 수 있음을 보인 것”이라고 설명했다.

그는 카이스트에서 전기및전자공학부 학·석·박사 학위를 취득한 후 2024년 같은 학과 교수로 부임했다. 한 교수는 미국 예일대 박사후연구원 시절부터 이어진 공동 연구자들과 인연을 계기로 2025년부터 구글리서치 방문연구원을 겸직하며 터보퀀트 연구를 해 왔다.

한 교수는 터보퀀트 구현의 핵심 기반인 다양한 데이터값을 균일하게 압축하는 ‘폴라퀀트’와 데이터를 정보 손실 없이 더 작게 압축하는 ‘양자화 존슨-린덴스트라우스 변환(QJL)’ 기술 연구에 참여한 유일한 한국 과학자다. 한 교수는 “앞으로도 구글리서치와 후속 연구를 이어갈 계획”이라며 “AI 추론 작업 시 연산 효율화 방향에 집중할 것”이라고 말했다.

이코노미조선에서 직접 확인하세요. 해당 언론사로 이동합니다.

경제

[HBM 수요 축소 가능성에 삼성전자·하이닉스 주가 급락] 반도체 쇼크 안긴 구글 논문… 터보퀀트 기술 효과 엇갈린 시각

Plus Point구글 터보퀀트 핵심 기술 연구 참여 유일 韓 과학자한인수 카이스트 교수 “AI 모델 즉시 적용 가능”

Plus Point
구글 터보퀀트 핵심 기술 연구 참여 유일 韓 과학자
한인수 카이스트 교수 “AI 모델 즉시 적용 가능”