[르포] 생성형AI용 밀키트 내놓은 VM웨어 "GPU팜 없어도 가능···엔비디아와 협력"

라스베이거스=정혜진 특파원 2023. 8. 23. 09:54
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

VM웨어 익스플로어 2023서
젠슨 황 엔비디아 CEO 등장해 협력 발표
소수 대기업 넘어 금융, 의료, 제조로 영역 넓힐 것
[서울경제]
22일(현지 시간) 미국 네바다주 라스베이거스 베네시안 컨벤션센터에서 열린 VM웨어 연례 최대 컨퍼런스인 ‘VM웨어 익스플로어 2023’에서 젠슨 황(왼쪽) 엔비디아 CEO가 지포스 RTX 4090을 든 채 라구 라구람 VM웨어 CEO와 대화하고 있다. /라스베이거스=정혜진 특파원

22일(현지 시간) 미국 네바다주 라스베이거스 베네시안 컨벤션센터에서 열린 VM웨어 연례 최대 컨퍼런스인 ‘VM웨어 익스플로어 2023’. 7000여명의 개발자와 파트너사들이 참여한 가운데 트레이드마크인 검은색 가죽 점퍼 아래 상하의 모두 검정으로 입은 젠슨 황 엔비디아 최고경영자(CEO)가 모습을 드러냈다. 한 손에는 소수의 참가자에게 선물하기 위한 친필 사인을 넣은 엔비디아의 인기 제품인 지포스 RTX 4090 상자를 든 채였다. AI칩 수요 폭발과 엔비디아 주가의 끝없는 상승 곡선으로 사방에서 러브콜을 받는 황 CEO가 올 2분기 실적 발표를 하루 앞두고 라스베이거스까지 날아온 이유에 관심이 모였다.

22일(현지 시간) 미국 네바다주 라스베이거스 베네시안 컨벤션센터에서 열린 VM웨어 연례 최대 컨퍼런스인 ‘VM웨어 익스플로어 2023’에서 젠슨 황(왼쪽) 엔비디아 CEO가 라구 라구람 VM웨어 CEO와 파트너십 방향에 대해 발표하고 있다. /라스베이거스=정혜진 특파원

대규모 언어 모델(LLM)의 학습에 필요한 엔비디아의 AI칩인 A100, H100은 품귀 현상을 빚으며 가격이 천정부지로 뛰고 있지만 이번 협업은 소위 ‘GPU 팜(Farm)’을 구축하지 않고도 자체 AI모델을 만들고 활용하는 데 초점을 맞췄다. 황 CEO는 “모든 기업이 비즈니스에 생성형AI 기술을 통합하기 위해 애쓰고 있지만 누구나 쉽게 하는 건 아니다”라며 “금융, 의료, 제조 등 분야를 막론하고 수십만 명의 고객에게 자체 데이터로 구축된 맞춤형 애플리케이션을 활용해 생성형AI 시너지를 낼 수 있도록 할 것”이라고 강조했다.

타깃으로 삼는 고객은 생성형AI를 활용하고 싶지만 자원과 인력이 부족해 어떻게 접근해야 할지 모르는 중소규모 기업이다. 내년 초 VM웨어와 엔비디아가 출시하는 VM웨어 프라이빗 AI 파운데이션 위드 엔비디아(Private AI Foundation with NVIDIA)를 통해 이용 기업은 원하는 대규모언어모델(LLM) 기반으로 맞춤형으로 제작된 지능형 챗봇, 어시스턴트, 검색, 요약 등 AI 애플리케이션을 활용할 수 있다. 필요한 인프라 자원과 보안 기능은 물론 애플리케이션까지 갖춰져 있어 직접 재료를 일일이 찾아 레시피를 개발하는 수고 대신 밀키트로 음식을 해먹는 일에 가깝다. 특히 기업 고유의 데이터를 자체적으로 보관하기 때문에 퍼블릭 클라우드를 이용할 경우 기업 고유의 데이터가 유출될 수도 있다는 우려에서 자유롭다 리스크에서 이용기업은 모델을 사용자 지정하고 지능형 챗봇, 어시스턴트, 검색, 요약을 비롯한 생성형 AI 애플리케이션을 실행할 수 있다.

22일(현지 시간) 미국 네바다주 라스베이거스 베네시안 컨벤션센터에서 열린 ‘VM웨어 익스플로어 2023’에서 라구 라구람 VM웨어 CEO가 프라이빗AI에 대해 소개하고 있다. /라스베이거스=정혜진 특파원

이날 라구 라구람 VM웨어 CEO는 “생성형AI와 멀티 클라우드는 완벽한 조합”이라며 “데이터 센터, 엣지, 클라우드 등 어디에나 있는 고객의 데이터를 완전히 보호하면서도 이 데이터를 바탕으로 생성형AI 워크로드를 안전하게 실행할 수 있는 게 강점”이라고 강조했다. 이어 “프라이빗AI를 통해 다른 방향으로 피벗하는 게 아니라 생성형AI 시대에 멀티 클라우드를 더욱 잘 활용할 수 있도록 그 일환으로 고안한 개념”이라고 덧붙였다.

22일(현지 시간) 미국 네바다주 라스베이거스 베네시안 컨벤션센터에서 열린 ‘VM웨어 익스플로어 2023’에서 전인호 VM웨어 한국 지사장이 프라이빗AI에 대해 소개하고 있다. /라스베이거스=정혜진 특파원

이와 더불어 VM웨어 클라우드 파운데이션을 기반으로 오픈 소스용 소프트웨어(OSS) 모델을 구축하고 제공하기 위한 개방형 레퍼런스 아키텍처도 제공한다. AI모델 커뮤니티인 허깅 페이스를 비롯해 최소한의 GPU로도 AI추론을 가능하게 하는 기업 애니스케일, 데이터 올인원 플랫폼 도미노 데이터랩 등 AI 전체 생태계의 강자들과의 협업의 결과 이들의 애플리케이션을 최적화해 제공한다. 개별 기업이 협업하기에는 쉽지 않은 기업들이지만 이 협업의 결과물을 오픈소스로 내놓아 많은 기업이 혜택을 보게 하겠다는 것이다. 현재 코딩 생성 AI모델인 ‘세이프 코드(Safe code)’를 베타 테스트하고 있다. 이를 두고 전인호 VM웨어 한국 지사장은 “이전에는 GPU를 여러 개 써서 AI모델을 구축할 수 있었지만 이제는 4코어 GPU 하나로도 4시간 만에 이를 할 정도로 효율성을 높였다”며 “GPU팜을 가지고 있지 않더라도 고객들이 가진 소규모 데이터와 프라이빗 클라우드만으로도 AI 모델을 만들고 활용할 수 있다”고 강조했다.

라스베이거스=정혜진 특파원 madein@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?