VM웨어, 엔비디아와 손잡고 “서버에서 생성형AI 돌리세요”

이덕주 기자(mrdjlee@mk.co.kr) 2023. 8. 23. 03:06
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

엔비디아와 ‘프라이빗 AI 파운데이션’ 공개
멀티클라우드, 자체 서버 등에서 LLM 사용가능
A100 텐서코어 대신 L40S GPU 사용
22일(현지시간) 미국 라스베이거스 베네시안 컨벤션 센터에서 열린 ‘익스플로러2023’ 행사 기조연설에서 젠슨 황 엔비디아 CEO(왼쪽)가 라구 라구람 VM웨어 CEO와 대화하고 있다. <이덕주 기자>
멀티클라우드 플랫폼 기업 VM웨어가 반도체 설계기업 엔비디아와 함께 서버 및 멀티클라우드에서 돌릴 수 있는 생성형 AI 플랫폼을 공개했다. 22일(현지시간) 미국 라스베이거스 베네시안 컨벤션 센터에서 열린 ‘익스플로러2023’ 행사 기조연설에서 라구 라구람 VM웨어는 이 같은 내용을 발표했다. 이 자리에는 젠슨 황 엔비디아 CEO가 직접 참석했다.

이날 VM웨어는 ‘프라이빗 AI 파운데이션 위드 엔비디아(Private AI Foundation with NVIDIA)’를 공개했다. 이를 통해 기업은 지능형 챗봇, 어시스턴트, 검색, 요약을 비롯한 생성형 AI 애플리케이션을 실행할 수 있다.

멀티클라우드는 AWS, MS 애저, 구글클라우드 등 특정 퍼블릭 클라우드만 사용하는 것이 아니라 여러 퍼블릭 클라우드 서비스와 프라이빗 클라우드, 서버까지 포함해서 사용하는 것을 말한다. 서버 가상화 기술에서 출범한 VM웨어가 공격적으로 밀고 있는 개념이다.

라구 라구람 VM웨어 CEO는 “생성형 AI와 멀티 클라우드는 완벽한 조합”이라며, “고객의 데이터는 데이터 센터, 엣지, 클라우드 등 어디에나 있다. VM웨어는 엔비디아와 함께 기업 데이터 개인 정보 보호, 보안, 제어 문제를 해결하면서도 데이터에 인접한 생성형 AI 워크로드를 안전하게 실행할 수 있도록 지원한다”라고 말했다.

젠슨 황 엔비디아 창업자 겸 CEO는 “모든 기업이 자사의 비즈니스에 생성형 AI를 통합하기 위해 경쟁하고 있다”며, “VM웨어와의 확장된 협업은 금융 서비스, 의료, 제조 등에 걸쳐 수십만 명의 고객에게 자체 데이터로 구축된 맞춤형 애플리케이션을 활용해 생성형 AI의 잠재력을 실현하는 데 필요한 풀 스택 소프트웨어와 컴퓨팅을 제공할 것이다”라고 말했다.

22일(현지시간) 미국 라스베이거스 베네시안 컨센션 센터에서 열린 ‘익스플로러2023’ 행사에서 젠슨 황 CEO 가 자신이 사인한 엔비디아 RTX 4090 GPU를 보여주고 있다.
VM웨어의 프라이빗 AI 파운데이션 위드 엔비디아는 2024년 초에 출시된다.

이 플랫폼에는 엔비디아 니모(NeMo)에서 라마(Llama) 2에 이르기까지 다양한 모델을 구축하고 실행하는 것이 가능하다. 또한, 델 테크놀로지스, 휴렛패커드엔터프라이즈, 레노버 같은 서버기업들이 지원한다. 이들은 엔비디아 L40S GPU와 엔비디아 블루필드-3 DPU, 그리고 엔비디아 커넥트X-7 스마트NIC를 통해 엔터프라이즈 LLM 커스터마이징과 추론 워크로드를 지원하게 된다.

엔비디아 L40S GPU는 엔비디아 A100 텐서 코어 GPU 대비 최대 1.2배 더 많은 생성형 AI 추론 성능과 최대 1.7배 더 많은 훈련 성능을 제공한다.

한편 젠슨 황 CEO 는 이 자리에 자신이 직접 사인한 5 대의 RTX 4090 GPU 를 가져와 추첨을 통해서 참석자들에게 제공했다. RTX 4090 은 게임을 위해 PC 에 부착하는 GPU 로 판매가격은 200만원 이상이다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?