KT 클라우드, 슬라이싱 GPU 기반 인프라 서비스 ‘AI SERV’ 출시

2023. 10. 16. 09:23
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

KT 클라우드가 슬라이싱 기술을 그래픽처리장치(GPU)에 적용한 인공지능(AI) 추론 전용 인프라 서비스 'AI SERV'를 출시했다.

KT 클라우드가 이번에 출시한 AI SERV는 AI 전문기업, 스타트업 등이 고성능 GPU 인프라를 각 서비스에 필요한 만큼 분할해 최적의 양을 사용할 수 있는 것이 특징이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

성능 열화 없는 GPU 슬라이싱 기술 적용
KT 클라우드가 ‘AI SERV’를 출시했다. [KT 클라우드 제공]

[헤럴드경제=박로명 기자] KT 클라우드가 슬라이싱 기술을 그래픽처리장치(GPU)에 적용한 인공지능(AI) 추론 전용 인프라 서비스 ‘AI SERV’를 출시했다.

KT 클라우드가 이번에 출시한 AI SERV는 AI 전문기업, 스타트업 등이 고성능 GPU 인프라를 각 서비스에 필요한 만큼 분할해 최적의 양을 사용할 수 있는 것이 특징이다. 비용을 절감할 수 있을 뿐 아니라 성능, 호환성 등을 갖춰 추론형 AI 인프라 시장의 혁신을 이끌 것으로 기대된다.

AI SERV에 적용된 슬라이싱은 기존에 한 장으로 제공되던 GPU 서비스를 5분할해 0.2장 단위로 제공하는 기술이다. 최소 사용 가능한 GPU 단위가 작아진 만큼 필요한 때 필요한 만큼의 인프라를 사용할 수 있어 가격 부담이 줄고, 상황에 맞춰 탄력적인 활용이 가능하다.

AI SERV는 슬라이싱 분할에도 성능 열화 없이 인프라를 최대로 활용할 수 있다는 강점을 갖췄다. 경쟁사와 비교해도 성능과 호환성 측면에서 앞선다고 회사 측은 밝혔다. 엔비디아 A100 칩을 활용, 경쟁사의 최신 추론형 인프라 서비스와 비교해도 최소 두 배 빠른 연산 속도를 자랑한다.

KT 클라우드는 향후 AI SERV에 사용자의 손쉬운 인프라 확장 지원을 위한 모니터링 및 컨테이너 이미지 클로닝(Cloning) 기능을 추가할 계획이다. 부하 발생시 인프라를 자동 확장시키는 ‘오토 스케일링’ 기능을 도입하는 등 서비스를 지속적으로 고도화해 나갈 계획이다.

윤동식 KT 클라우드 대표는 “이번 AI SERV 출시로 고객들이 AI 학습부터 추론, 서빙 환경 구성까지 각 단계에서 최적의 인프라를 보다 합리적인 비용으로 사용할 수 있게 됐다”며 “다양한 AI 전문기업, 스타트업들이 부담 없이 AI 인프라를 활용하도록 힘쓰겠다”고 말했다.

dodo@heraldcorp.com

Copyright © 헤럴드경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?