‘챗GPT 대형 AI’ 학습비용 대폭절감…KAIST·삼성 ‘시뮬레이션 프레임워크’ 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
최근 ChatGPT, DeepSeek 등 초거대 인공지능(AI) 모델이 다양한 분야에서 활용되며 주목받고 있다.
이러한 대형 언어 모델은 수만 개의 데이터센터용 GPU를 갖춘 대규모 분산 시스템에서 학습되는데, GPT-4의 경우 모델을 학습하는 데 소모되는 비용은 약 1400억 원에 육박하는 것으로 추산된다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
![유민수 KAIST 전기및전자공학부 교수.[KAIST 제공]](https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/13/ned/20250313080125486nwre.jpg)
[헤럴드경제=구본혁 기자] 최근 ChatGPT, DeepSeek 등 초거대 인공지능(AI) 모델이 다양한 분야에서 활용되며 주목받고 있다. 이러한 대형 언어 모델은 수만 개의 데이터센터용 GPU를 갖춘 대규모 분산 시스템에서 학습되는데, GPT-4의 경우 모델을 학습하는 데 소모되는 비용은 약 1400억 원에 육박하는 것으로 추산된다. 국내 연구진이 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 최적의 병렬화 구성을 도출하도록 돕는 기술을 개발했다.
KAIST는 전기및전자공학부 유민수 교수 연구팀은 삼성전자 삼성종합기술원과 공동연구를 통해, 대규모 분산 시스템에서 대형 언어 모델(LLM)의 학습 시간을 예측하고 최적화할 수 있는 시뮬레이션 프레임워크(vTrain)를 개발했다고 13일 밝혔다.
대형 언어 모델 학습 효율을 높이려면 최적의 분산 학습 전략을 찾는 것이 필수적이다. 그러나 가능한 전략의 경우의 수가 방대할 뿐 아니라 실제 환경에서 각 전략의 성능을 테스트하는 데는 막대한 비용과 시간이 들어간다.
이에 따라 현재 대형 언어 모델을 학습하는 기업들은 일부 경험적으로 검증된 소수의 전략만을 사용하고 있다. 이는 GPU 활용의 비효율성과 불필요한 비용 증가를 초래하지만, 대규모 시스템을 위한 시뮬레이션 기술이 부족해 기업들이 문제를 효과적으로 해결하지 못하고 있는 상황이다.
연구팀은 vTrain을 개발해 대형 언어 모델의 학습 시간을 정확히 예측하고, 다양한 분산 병렬화 전략을 빠르게 탐색할 수 있도록 했다.
![vTrain 시뮬레이터 구조 모식도.[KAIST 제공]](https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/13/ned/20250313080126090vjwn.png)
연구팀은 실제 다중 GPU 환경에서 다양한 대형 언어 모델 학습 시간 실측값과 vTrain의 예측값을 비교한 결과, 단일 노드에서 평균 절대 오차(MAPE) 8.37%, 다중 노드에서 14.73%의 정확도로 학습 시간을 예측할 수 있음을 검증했다.
연구팀은 삼성전자 삼성종합기술원와 공동연구를 통해 vTrain 프레임워크와 1500개 이상의 실제 학습 시간 측정 데이터를 오픈소스로 공개해 AI 연구자와 기업이 이를 자유롭게 활용할 수 있도록 했다.
유민수 교수는 “vTrain은 프로파일링 기반 시뮬레이션 기법으로 기존 경험적 방식 대비 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 학습 전략을 탐색하였으며 오픈소스를 공개했다”면서 “이를 통해 기업들은 초거대 인공지능 모델 학습 비용을 효율적으로 절감할 것”이라고 말했다.
Copyright © 헤럴드경제. 무단전재 및 재배포 금지.
- ‘대전 초등생 살인’ 48세 교사 명재완 신상공개 [세상&]
- 뉴진스 팬덤 3만 명, “전속 활동 강제는 고통 연장” 탄원서 제출
- 아이유·박보검의 요망진 드라마 ‘폭싹 속았수다’…글로벌 톱4로 출발
- ‘옥순이’마저 등 돌렸다, 이렇게 심각할 줄은…“겪어보면 안다”
- 선예 “원더걸스 재결합 가능성? 좋은 기회 되면…”
- ‘미성년자 교제 논란’ 김수현…광고계 ‘손절’ 시작되나
- BTS 지민, 美 빌보드 ‘핫100’ 역대 K-팝 솔로 최장 차트인
- “슬프다”“의욕 넘쳤는데” 휘성이 한달 전 지인에게 보낸 카톡
- “7억 달라니…오빠 나 좀 살려줘” 故김새론, 김수현에 보낸 문자
- ‘폭싹’30대 아이유가 여고생교복이 이렇게 잘 어울릴 줄 몰랐다