비싼 엔비디아 GPU 없이도 ‘AI 학습’… 카이스트 연구팀 신기술 개발

구혁 기자 2024. 9. 19. 11:59
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국내 연구진이 초고가의 고성능 GPU 대신 일반 소비자용 GPU를 활용한 인공지능(AI) 학습 기술을 개발해 AI 연구의 진입장벽이 낮아질 전망이다.

카이스트는 한동수 전기및전자공학부 교수팀이 일반 소비자용 GPU를 활용해 제한된 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술을 개발했다고 19일 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

20배 저렴한 일반 GPU 활용
학습속도 최대 104배 높여

국내 연구진이 초고가의 고성능 GPU 대신 일반 소비자용 GPU를 활용한 인공지능(AI) 학습 기술을 개발해 AI 연구의 진입장벽이 낮아질 전망이다. 카이스트는 한동수 전기및전자공학부 교수팀이 일반 소비자용 GPU를 활용해 제한된 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술을 개발했다고 19일 밝혔다.

한 교수팀은 고성능 GPU인 엔비디아 H100보다 10∼20배 저렴한 소비자용 GPU를 활용해 일반 인터넷 환경에서도 효율적인 분산 학습을 가능케 하는 ‘스텔라트레인’ 프레임워크를 개발했다. 기존엔 저가 GPU를 사용해 대규모 AI 모델을 학습할 경우 작은 메모리와 네트워크 속도 제한으로 인해 학습 속도가 수백 배 느려지는 한계가 있었으나, CPU와 GPU를 병렬로 활용하고 네트워크 속도에 맞춰 데이터를 효율적으로 압축·전송하는 알고리즘을 적용해 이를 극복한 것이다. 연구 결과 스텔라트레인 기술을 사용하면 기존의 데이터 병렬 학습보다 최대 104배 빠른 성능을 낼 수 있는 것으로 나타났다.

기존에는 AI 모델을 학습하기 위해 H100 등 개당 수천만 원에 달하는 고성능 서버용 GPU 여러 대와 이들을 연결하기 위한 400Gbps급 고속 네트워크가 필요했다. 이는 소수의 빅테크를 제외한 다수의 연구자와 기업에 AI 연구의 진입장벽으로 여겨져 왔다. 한 교수는 “이번 연구가 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있게 하는 데 기여할 것”이라며 “앞으로도 저비용 환경에서도 대규모 AI 모델을 학습할 수 있는 기술 개발을 계속할 계획”이라고 밝혔다.

구혁 기자 gugija@munhwa.com

Copyright © 문화일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?