KAIST, AI반도체 메모리 한계 극복 ‘CXL-GPU’ 개발

김윤수 기자 2024. 7. 8. 15:46
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 반도체로 널리 쓰이는 그래픽처리장치(GPU)의 메모리 용량 한계를 극복할 기술이 국내에서 개발됐다.

한국과학기술원(KAIST)은 정명수 전기및전자공학부 교수 연구팀이 차세대 인터페이스 기술인 컴퓨트익스프레스링크(CXL)이 활성화한 고용량 GPU 장치의 메모리 읽기·쓰기 성능을 최적화하는 기술을 개발했다고 8일 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

GPU 메모리 용량에 연산 성능 한계
CXL 도입해 메모리 효율적 확장
[서울경제]

인공지능(AI) 반도체로 널리 쓰이는 그래픽처리장치(GPU)의 메모리 용량 한계를 극복할 기술이 국내에서 개발됐다.

파네시아의 CXL-GPU. 사진 제공=KAIST

한국과학기술원(KAIST)은 정명수 전기및전자공학부 교수 연구팀이 차세대 인터페이스 기술인 컴퓨트익스프레스링크(CXL)이 활성화한 고용량 GPU 장치의 메모리 읽기·쓰기 성능을 최적화하는 기술을 개발했다고 8일 밝혔다.

GPU의 내부 메모리 용량은 수십GB에 불과해 스스로 추론·학습하는 데는 한계가 있는 상황이다. 대규모 AI 모델을 구동하기 위해 여러 GPU를 연결하는 방식이 쓰이지만 이는 비용 부담의 문제로 이어진다.

연구팀은 중앙처리장치(CPU)와 GPU, 저장장치 등을 효율적으로 연결해주는 CXL을 활용해 대용량 메모리를 GPU에 직접 연결시키는 ‘CXL-GPU’를 대안으로 제시했다. CXL-GPU의 기존 성능 저하 문제를 개선해 효율적으로 설계하는 기술을 개발했다. 연구팀은 반도체 팹리스 스타트업 파네시아의 CXL-GPU 시제품을 활용한 기술 실효성 검증을 통해 기존 GPU 메모리 확장 기술보다 2.36배 빠르게 AI 서비스를 실행할 수 있음을 확인했다.

연구성과는 이달 산타클라라 USENIX 연합학회와 핫스토리지의 연구 발표장에서 공개된다. 정 교수는 “CXL-GPU의 시장 개화 시기를 가속해 대규모 AI 서비스를 운영하는 빅테크 기업의 메모리 확장 비용을 획기적으로 낮추는 데 기여할 수 있을 것”이라고 기대했다.

김윤수 기자 sookim@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?