고가 GPU 없어도 `AI 학습` 가능해진다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
고가의 그래픽처리장치(GPU)나 고속 네트워크 없이 AI 모델을 효율적으로 학습할 수 있는 기술이 개발됐다.
아울러 GPU 활용률을 실시간 모니터링해 AI 모델이 학습하는 샘플의 개수를 동적으로 결정하고, 변화하는 네트워크 대역폭에 맞춰 GPU 간 데이터 전송을 효율화하는 기술을 개발해 원거리 분산 환경에서도 GPU 연산 효율을 높였다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
최대 104배 빠른 성능 선보여
고가의 그래픽처리장치(GPU)나 고속 네트워크 없이 AI 모델을 효율적으로 학습할 수 있는 기술이 개발됐다. AI 인프라 자원이 제한된 기업이나 연구자들이 AI 연구를 보다 효과적으로 하는 길이 열릴 것으로 기대된다.
KAIST는 한동수 전기및전자공학부 교수 연구팀이 일반 소비자용 GPU를 이용해 네트워크 대역폭이 제한된 분산 환경에서도 AI 모델을 최대 104배 빠르게 학습할 수 있는 '스텔라트레인 프레임워크'를 개발했다고 19일 밝혔다.
AI 모델을 학습하려면 수천만원에 달하는 고성능 서버용 GPU 여러 대와 이들을 연결하는 400Gbps급 고속 네트워크로 구성된 고가의 인프라가 필요하다. 이 때문에 거대 IT 기업을 제외한 대다수의 기업과 연구자들은 비용 문제로 어려움을 겪는다.
연구팀은 엔비디아의 고성능 GPU 'H100'에 비해 10∼20배 저렴한 소비자용 GPU를 활용해 고속의 전용 네트워크 대신 일반 인터넷 환경에서 효율적인 분산 학습이 가능한 '스텔라트레인 프레임워크'를 개발했다. 스텔라트레인 기술은 CPU와 GPU를 병렬로 활용해 학습 속도를 높이고, 네트워크 속도에 맞춰 데이터를 효율적으로 압축·전송하는 알고리즘을 적용해 고속 네트워크 없이도 여러 대의 저가 GPU를 이용해 빠른 학습이 가능하다.
연구팀은 학습을 작업 단계별로 CPU와 GPU가 나눠서 병렬적으로 처리할 수 있는 새로운 파이프라인 기술을 도입해 연산 자원의 효율을 높였다. 아울러 GPU 활용률을 실시간 모니터링해 AI 모델이 학습하는 샘플의 개수를 동적으로 결정하고, 변화하는 네트워크 대역폭에 맞춰 GPU 간 데이터 전송을 효율화하는 기술을 개발해 원거리 분산 환경에서도 GPU 연산 효율을 높였다.
이를 통해 기존 데이터 병렬 학습에 비해 최대 104배 빠른 성능을 낼 수 있다고 연구팀은 설명했다. 앞서 연구팀은 지난 7월 소수의 GPU로 거대언어모델(LLM)을 학습할 수 있는 프레임워크 기술을 개발한 바 있다.
한동수 KAIST 교수는 "대규모 AI 모델 학습을 누구나 고가의 인프라 없이 할 수 있도록 지원한다"며 "앞으로 저비용 환경에서도 대규모 AI 모델을 학습할 수 있는 기술을 지속적으로 개발하겠다"고 말했다.
이 연구결과는 지난 8월 호주 시드니에서 열린 'ACM SIGCOMM 2024'에서 발표됐다.이준기기자 bongchu@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- 벤틀리·명품백 받은 남현희…경찰 "죄 안된다" 청탁금지법 위반혐의 불송치
- 주차 시비 말리다 뇌사 빠진 60대 아파트 경비원 끝내 사망
- 딸도 있는 아내 폭행하고 1000회 넘게 성매매 시킨 남편
- 유아인 `동성 성폭행 혐의` 불송치…경찰 "증거 불충분"
- "벌금만 2억7000만원"…아버지와 아들, 국립공원서 도대체 뭘 훔쳤길래
- [트럼프 2기 시동]트럼프 파격 인사… 뉴스앵커 국방장관, 머스크 정부효율위 수장
- 거세지는 ‘얼죽신’ 돌풍… 서울 신축 품귀현상 심화
- 흘러내리는 은행 예·적금 금리… `리딩뱅크`도 가세
- 미국서 자리 굳힌 SK바이오팜, `뇌전증약` 아시아 공략 채비 마쳤다
- 한화, 군함 앞세워 세계 최대 `美 방산시장` 확장