'터보퀀트' 참여 KAIST 교수 "AI 반도체 수요 고도화"

조승한 2026. 3. 27. 15:47
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

"효율 중심 AI 시대…핵심 기반기술 될 것"
한국 반도체 기회·위기 공존…"AI 칩 회사로 변신해야"
구글 제미나이 (EPA=연합뉴스)

(서울=연합뉴스) 조승한 기자 = 구글이 인공지능(AI) 성능을 좌우해온 '메모리 병목'을 뚫기 위해 제시한 차세대 알고리즘 '터보퀀트'가 메모리 반도체 시장에 충격을 주고 있다.

터보퀀트 연구에 참여한 한인수 한국과학기술원(KAIST) 전기및전자공학부 교수는 27일 KAIST를 통해 "AI가 고용량 중심에서 고효율 중심으로 전환되면서, AI는 더 저렴해지고 빠르게 확산하는 동시에 반도체 수요 역시 질적으로 고도화될 전망"이라고 밝혔다.

터보퀀트는 최대 6배까지 메모리를 줄이면서도 성능을 유지하는 차세대 양자화 알고리즘이다.

AI 모델은 입력 데이터를 벡터 형태로 바꾼 뒤 벡터 간 유사도를 계산해 작동한다.

한인수 KAIST 전기및전자공학부 교수 [KAIST 제공. 재판매 및 DB 금지]

이 과정에서 고정밀 데이터가 필요해 막대한 메모리 자원이 필요한데, 터보퀀트는 이를 더 적은 비트로 압축해 표현하는 양자화 기술을 활용했다.

소수점 데이터를 정수로 근사하는 방식으로 핵심 정보를 유지하면서도 저장 용량과 연산 부담은 크게 줄이면서도 정확도 저하는 거의 없는 것으로 나타났다.

터보퀀트는 우선 1단계에서 입력 데이터를 무작위로 회전시킨 뒤 각 요소를 개별 양자화해 데이터 내 극단값을 줄여 압축 효율을 높인다.

이 방식은 한 교수가 기존에 참여한 '폴라퀀트' 연구에서도 활용됐다.

이어 2단계에서는 1단계 오차를 다시 한번 양자화해 데이터를 -1, 1 값으로만 표현하는 QJL(Quantized Johnson-Lindenstrauss) 기법으로 연산 효율을 극대화한다.

한 교수는 이번 기술이 반도체 메모리 시장에 중장기 활력을 불어넣을 것으로 기대했다.

단기적으로 동일 AI 모델 구동에 필요한 메모리 용량이 줄어들어 수요 성장이 둔화하는 것으로 보이지만 AI 대중화의 기폭제가 될 수 있다는 설명이다.

한 교수는 "이번 연구는 AI 메모리 사용량 증가 병목을 효과적으로 줄이면서도 정확도를 유지할 수 있는 새로운 방향을 제시했다"며 "대규모 AI 모델을 더욱 효율적으로 운영할 수 있는 핵심 기반 기술로 활용될 것으로 기대한다"고 말했다.

반도체 전문가들도 터보퀀트가 반도체 시장을 키우게 될 것이라며, 한국 메모리 반도체도 시장 재편 과정에서 위기와 기회를 동시에 마주하게 될 것으로 보고 있다.

발표하는 권석준 교수 (서울=연합뉴스) 23일 오전 서울시 중구 대한상공회의소에서 열린 '한미 산업협력 컨퍼런스'에서 권석준 성균관대학교 교수가 '미 대선이 반도체 산업에 미치는 영향과 한미협력 방안'이라는 주제로 발표하고 있다. 2024.9.23 [대한상공회의소 제공. 재판매 및 DB 금지] photo@yna.co.kr

'반도체 삼국지' 저자인 권석준 성균관대 교수는 "현실에서는 메모리 수요 변동이 단순하게 정보량 압축 효과에 비례해 흘러갈 가능성이 높지 않다"며 "메모리 업체들에는 기회이자 동시에 위협, 두 가지가 오는 것"이라고 평가했다.

우선 그는 추론 비용이 정말 낮아진다면 지금까지 비용 때문에 못쓰던 응용 작업에 절약한 메모리를 사용하게 되며 메모리 수요가 더 폭발적으로 늘 수도 있다고 전망했다.

마치 석탄 효율이 올라가자 석탄 소비가 늘어난 '제본스 역설'처럼 흘러갈 가능성이 높다고 평가한 것이다.

또 그는 "엔비디아가 강조해온 지능형 컨트롤러 메모리 스토리지(ICMS) 역할도 단순한 보조 저장소를 넘어 '문맥 교통정리' 핵심 계층으로 재정의되며 GPU당 배치되는 시스템 개수가 늘어나면 메모리 수요는 더 늘어날 수도 있다"며 "언어처리장치(LPU)와 상보성도 더 강화돼 전체 파이가 커질 수 있다"고 그는 설명했다.

이렇게 되면서 반도체 시장이 AI 서비스 맞춤형으로 차별화하기 쉬워지게 되면 국내 반도체 기업에는 기회이자 동시에 위협이 될 것이라고 그는 설명했다.

권 교수는 "어느 시점부터는 터보퀀트같은 메모리 절약 방식뿐 아니라 온갖 메모리 압축, 재활용 등 방법론을 들고나오는 고객사들이 더 많이 출현할 것"이라며 "메모리 회사가 이제는 고객사들 맞춤형 설계에 대응할 수 있는 사실상 AI 칩 회사로 변신해야 한다는 것"이라고 말했다.

그는 삼성전자와 SK하이닉스가 올해 상반기 어떤 선택을 하느냐에 따라 향후 5년의 경쟁력을 결정할 가능성이 높다고 강조했다.

그는 "구글의 터보퀀트는 메모리 수요를 파괴하는 게 아니라, 메모리 산업의 게임 룰을 바꾸는 기술"이라며 결국 지능형 메모리 중심 AI 컴퓨팅 설루션을 팔아야 하는 시대에서 준비된 쪽이 이기는 게임이 될 것이라고 제언했다.

shjo@yna.co.kr

▶제보는 카톡 okjebo

Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지