연세대 대학원생 2명, AI 학회 ‘ICML’에 논문 공동 1저자 채택

연세대학교(총장 윤동섭) 시스템반도체공학과 박민재 석사과정생과 전기전자공학부 김수성 석박사통합과정생이 인공지능(AI) 학회 ‘ICML 2026’에 논문 공동 1저자로 채택됐다. 두 학생은 대학원 진학 뒤 1년 반 만에 연구 성과를 냈다.
채택 논문은 ‘GSRQ: Gain–Shape Residual Quantization for Sub-1-bit KV Cache’다. 하드웨어-AI 융합(HAI) 연구실을 이끄는 정재용 교수(교신저자)와 정의영 교수의 지도 아래 진행됐다.
연구팀은 AI 모델의 메모리 효율을 높이기 위한 KV 캐시(KV Cache) 압축 기술을 제시했다. KV 캐시는 AI가 긴 문맥을 처리할 때 핵심 정보를 임시로 저장하는 공간이다. 문맥이 길어질수록 캐시 저장 공간이 커져 AI 모델보다 더 많은 메모리를 차지하는 문제가 발생한다.
이를 해결하기 위해 업계에서는 캐시에 저장되는 숫자를 적은 비트로 줄이는 양자화(Quantization) 기술을 연구해 왔다. 연세대 연구팀은 하나의 숫자를 1비트 이하로 압축하면서도 정보 손실을 줄이는 ‘GSRQ’ 기술을 개발했다. 연구팀은 머신러닝의 표준 알고리즘으로 쓰여 온 ‘K-means’가 초고차원 데이터에서 갖는 구조적 한계도 분석하고 이를 보완하는 방법을 제시했다.
이번 연구는 차세대 AI 하드웨어 아키텍처 적용 가능성도 제시했다. 에이전틱 AI 환경에서는 여러 작업 사이에서 맥락을 바꾸는 콘텍스트 스위칭(Context Switching)이 자주 발생한다. 이 과정에서 중앙처리장치(CPU)와 그래픽처리장치(GPU)가 메모리를 공유하는 이기종 아키텍처의 필요성이 커지고 있다. 연구팀의 초고도 압축 기술은 이런 환경에서 데이터 처리 효율을 높일 수 있다.
정재용 연세대 교수는 “KV 캐시 압축과 새로운 컴퓨팅 아키텍처의 결합은 AI 학계와 산업계가 경쟁하는 분야”라며 “학생들이 관련 연구에서 주도적인 성과를 냈다는 점에서 의미가 있다”고 말했다.
이번 연구는 과학기술정보통신부와 정보통신기획평가원(IITP)이 지원하는 ‘AI반도체혁신연구소’ 사업의 일환으로 수행됐다. ICML 2026은 7월 서울 코엑스에서 열릴 예정이다. 김수성·박민재 학생은 학술대회에서 연구 결과를 발표할 예정이다.
김나혜 인턴기자 kim.nahye1@joongang.co.kr
Copyright © 중앙일보. 무단전재 및 재배포 금지.
- “삼전닉스 이때 팔고 떠나라” 한국 ETF 대부, 대신 픽한 4가지 | 중앙일보
- “시모도 이것 먹고 장수” 췌장암 이긴 89세의 ‘비밀 양념’ | 중앙일보
- “월 110만원, 밖에선 턱없다” 200명이나 대기한 실버타운 ① | 중앙일보
- “아들에 성관계 영상 보낸다”…전업주부 성착취 ‘악몽의 인플루언서’ | 중앙일보
- “과외교사가 10대 자매 성폭행”…40대 ‘악몽의 과외’ 충격 | 중앙일보
- “과장 옆 앉아” “오빠라 불러”…숨진 여성 소방관, 24번 회식지옥 | 중앙일보
- “정산금 20억 이상 못받아”…가수 이무진, 전속계약 해지 소송 | 중앙일보
- “운동복 커플, 2만원 내고 뷔페 먹어”…기막힌 결혼식 암행투어 | 중앙일보
- 벤 “배신감 감당 힘들었다”…출산 6개월 만에 이혼 결심한 이유 | 중앙일보
- 여교사 12명 당했다…어린이집 화장실 ‘몰카’ 범인의 충격 정체 | 중앙일보