“GPU 빌려쓴다”⋯ AX 수요 폭발에 ‘GPUaaS’ 전쟁 가열

AI 시대를 맞아 기업들이 너나 할 것 없이 AI 전환(AX)을 시도 중이지만 급격한 수요 증가와 국제 정세 불안, 칩플레이션 등 복합 난제에 부딪쳤다. 그러자 국내 ICT 기업들은 고객이 그래픽처리장치(GPU)를 탄력 운용할 수 있는 ‘GPUaaS(서비스형 GPU)’ 상품을 잇따라 출시하고 시장 선점에 나섰다.
GPUaaS는 고성능 그래픽 처리 장치(GPU) 자원을 클라우드 기반으로 빌려 쓰는 구독형 서비스다. GPUaaS를 이용하면 기업은 수천억원에 달하는 초기 투자 비용과 GPU 운용 및 관리에 필요한 자원 소모를 최소화한 상태에서 AX 진행이 가능하다.
25일 ICT 업계에 따르면 SK텔레콤은 지난해 엔비디아 GPU ‘블랙웰 B200’ 1000장 이상을 단일 클러스터로 구성한 고성능 GPU 인프라 ‘해인’을 가동, 소버린 GPUaaS 서비스를 시작했다. SKT는 해인에 자체 가상화 솔루션 ‘페타서스 AI 클라우드’를 적용했고, AI 개발·운영 통합 관리 플랫폼 ‘AI 클라우드 매니저‘까지 제공한다.
KT는 엔비디아 GPU ‘H100’을 월 구독 형태로 이용하는 ‘K GPUaaS’를 시작했다. K GPUaaS는 초고속 네트워크 기술인 ‘인피니밴드’를 바탕으로 GPU 서버 간 지연 없는 통신을 제공해 대규모 분산 학습 환경을 구현한다. 또한, ‘GPU 가상화 분할’ 기술로 하나의 GPU를 여러 단위로 나눠 작업량에 따라 자원을 배분, 조정토록해 활용 효율을 높였다. 모든 GPU 인프라와 데이터, 네트워크는 국내에서 관리해 고객 데이터 해외로 유출 우려를 낮췄다.

네이버클라우드는 자체 설립한 AI 데이터센터 ‘각 세종’에서 대규모 GPU 클러스터를 직접 설계·운영하며 냉각·전력·네트워크 등 데이터센터 핵심 인프라를 자체적으로 설계하고 AI 워크로드에 최적화하는 기술을 내재화했다. 이 같은 ‘풀스택 AI 인프라’를 기반으로 GPUaaS 서비스를 제공 중이다.
카카오엔터프라이즈는 지난해 하반기 ‘하이브리드 GPUaaS’를 출시했다. 하이브리드 GPUaaS는 고객이 GPU를 자산으로 소유하고 카카오클라우드가 GPU 클러스터를 구축·운영을 전담하는 방식으로 운영된다.
삼성SDS는 국내 최초로 자사 클라우드 ‘SCP(삼성 클라우드 플랫폼)’을 통해 엔비디아 최신 GPU인 ‘B300’ 기반 GPUaaS를 출시했다. 삼성SDS는 AI 모델을 적용할 때 별도의 인프라 사용료 없이 사용한 토큰양만큼 비용을 지불하는 ‘서버리스 추론’ 서비스와 개발자가 코드와 데이터를 입력하면 자동으로 즉시 AI를 분산학습시키는 ‘AI 학습’ 서비스 등을 3분기 중 출시한다.
한편, 시장조사기관 리서치 네스터는 글로벌 GPUaaS 시장 규모가 올해 76억 1000만 달러(한화 약 11조 4038억원)를 넘어서고 2035년에는 692억 5000만 달러(한화 약 103조 7727억원)을 돌파할 것으로 추산했다. 연평균 성장률(CAGR)이 27.5%를 넘는다.
박준영 기자 pjy60@viva100.com