엔비디아 GPU 없어도 AI학습 길 열었다

백종민 2024. 9. 19. 08:56
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

고가의 데이터센터급 그래픽처리장치(GPU)나 고속 네트워크 없이도 인공지능(AI) 모델을 효율적으로 학습할 수 있는 기술이 국내연구진에 의해 개발됐다.

카이스트(총장 이광형)는 전기및전자공학부 한동수 교수 연구팀이 일반 소비자용 GPU를 활용해, 네트워크 대역폭이 제한된 분산 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술을 개발했다고 19일 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카이스트 한동수 교수팀 개발
일반 PC로도 빠른 AI 학습 가능
기존 데이터 병렬학습에 비해 최대 104배 빠른 성능
학계·중소기업의 AI 연구 및 개발 가속화 기대

고가의 데이터센터급 그래픽처리장치(GPU)나 고속 네트워크 없이도 인공지능(AI) 모델을 효율적으로 학습할 수 있는 기술이 국내연구진에 의해 개발됐다.

KAIST 전기및전자공학부 한동수 교수

카이스트(총장 이광형)는 전기및전자공학부 한동수 교수 연구팀이 일반 소비자용 GPU를 활용해, 네트워크 대역폭이 제한된 분산 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술을 개발했다고 19일 밝혔다.

AI 모델을 학습하기 위해 개당 수천만 원에 달하는 고성능 서버용 GPU인 엔비디아 H100, A100이나 이들을 연결하기 위한 400Gbps급 고속 네트워크를 가진 고가 인프라가 필요하다. 자본이 풍부한 빅테크(대형 정보기술 기업)들은 수만대의 GPU를 사들여 AI를 학습하는 반면 대부분의 기업과 연구자들은 비용 문제로 이러한 고가의 인프라를 도입하기 어려웠다.

한동수 교수 연구팀은 이러한 문제를 해결하기 위해 '스텔라트레인(StellaTrain)'이라는 분산 학습 프레임워크를 개발했다. 이 기술은 고성능 일반 PC 이용자들이 사용하는 소비자용 GPU 여러 대를 활용해, 고속의 전용 네트워크 대신 대역폭이 수백에서 수천 배 낮은 일반 인터넷 환경에서도 효율적인 분산 학습을 가능하게 한다. 대규모 AI 모델 학습 시 고급 GPU가 없으면 속도가 수백 배 느려지는 문제를 해결한 것이다. 연구팀은 스텔라트레인 기술을 사용하면 기존의 데이터 병렬 학습에 비해 최대 104배 빠른 성능을 낼 수 있다고 설명했다.

한동수 교수는 "이번 연구가 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있게 하는 데 큰 기여를 할 것"이라며 “앞으로도 저비용 환경에서도 대규모 AI 모델을 학습할 수 있는 기술 개발을 계속할 계획”이라고 말했다. 한 교수는 스텔라트레인을 개발자 플랫폼인 '깃허브'에 오픈소스로 공개해 누구나 사용할 수 있도록 했다.

이번 연구는 KAIST 임휘준 박사, 예준철 박사과정 학생, UC 어바인의 산기타 압두 조시(Sangeetha Abdu Jyothi) 교수와 공동으로 진행됐으며, 연구 성과는 지난 8월 호주 시드니에서 열린 ACM SIGCOMM 2024에서 발표됐다.

백종민 기자 cinqange@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?