메모리 적게쓰는 기술 보유 … 英 Arm도 구애
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
구글이 최근 인공지능(AI) 모델의 메모리 사용량을 줄이는 '터보퀀트'를 공개하면서 AI 산업의 경쟁 축이 바뀌고 있다.
초거대 모델 경쟁보다 추론 비용을 낮추고 메모리 효율을 높이는 기술이 중요해졌다는 분석이다.
구글은 지난달 24일 양자화를 통해 AI 모델의 메모리 사용을 줄이는 터보퀀트 기술을 공개했다.
스퀴즈비츠는 2022년부터 양자화를 활용해 AI 모델 크기를 줄이고 그래픽처리장치(GPU) 메모리 사용을 낮추면서 추론 속도를 높이는 기술을 개발해왔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
모델 개발 경쟁에서 벗어나
전력·메모리 최적화 초점

구글이 최근 인공지능(AI) 모델의 메모리 사용량을 줄이는 '터보퀀트'를 공개하면서 AI 산업의 경쟁 축이 바뀌고 있다. 초거대 모델 경쟁보다 추론 비용을 낮추고 메모리 효율을 높이는 기술이 중요해졌다는 분석이다. 기존 국내 AI 경량화·최적화 전문 스타트업도 글로벌 기업과 협업 공간을 넓히며 존재감을 키우고 있다.
구글은 지난달 24일 양자화를 통해 AI 모델의 메모리 사용을 줄이는 터보퀀트 기술을 공개했다. 최근 메모리반도체 공급 부족과 비용 부담이 커지면서 AI 업계의 관심도 자연스럽게 추론 효율화 쪽으로 이동하고 있다.
이 흐름 속에서 국내 스타트업이 기회를 잡고 있다. 노타는 자체 플랫폼 '넷츠프레소'를 통해 모델 크기와 연산량을 줄이고 하드웨어에 최적화하는 AI 경량화 기술을 보유한 기업이다.
지난달 노타는 글로벌 반도체 설계 기업 암(Arm)과 AI 경량화·최적화 플랫폼 라이선스 계약을 체결했다. 신경망처리장치(NPU), 데이터센터 등 Arm의 주요 라인업에서 파트너로 들어간 것이다.
AI 모델 경량화 전문 스타트업 스퀴즈비츠도 비슷한 흐름에 올라탔다. 스퀴즈비츠는 2022년부터 양자화를 활용해 AI 모델 크기를 줄이고 그래픽처리장치(GPU) 메모리 사용을 낮추면서 추론 속도를 높이는 기술을 개발해왔다.
최근 스퀴즈비츠도 자사 기술력을 해외에 선보였다. 지난달 엔비디아 GTC 2026에 참가해 처음으로 부스를 운영했다. 또한 누적 투자금 4000억원이 넘는 미국 유니콘 스타트업 모듈러와 파트너십을 통해 개발한 AI 모델을 시연했다.
[박성배 기자]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “세금 남는다며 마통 왜 썼지?”…한은서 17조 빌려 쓴 정부, 이자만 77억 - 매일경제
- [속보] 트럼프 “수십대 항공기 투입해 F-15 조종사 구출” - 매일경제
- “올해 일본도 넘는다”…‘K-반도체’ 호황에 작년 수출 첫 7000억 달러 돌파 - 매일경제
- “슈퍼리치들의 주식투자, 역시 달라”…전쟁 중에 원전·방산 팔고 삼전 매집 - 매일경제
- 시끄럽다 때리고 정리안한다 때리고…‘캐리어 시신’ 사건 전말 ‘처참’ - 매일경제
- [속보] 미군, 이란서 격추된 F-15 두번째 탑승자도 구조 - 매일경제
- “너 대학 못 가게 한다”…알바생에 550만원 뜯어 낸 카페 점주, 녹취록 ‘경악’ - 매일경제
- “드라마 촬영이 벼슬이냐”…벚꽃 명소 이 동네 무슨 일? - 매일경제
- “요즘 집 구할 때 ‘노룩 전세’ 알죠?”…한달새 전세보증금 ‘1억’ 껑충 - 매일경제
- 손흥민, 57분만 뛰고도 4도움 폭발! LAFC, 올랜도에 대승 - MK스포츠