[GTC 2026] 엔비디아, AI 팩토리 전용 '운영체제' 다이나모 1.0 공개…추론 성능 최대 7배 향상

양정민 기자 2026. 3. 17. 17:28
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈소스 무료 제공…AWS·구글·쿠팡·소프트뱅크 등 글로벌 기업 잇달아 채택

엔비디아가 'GTC 2026'에서 대규모 AI 추론을 위한 오픈소스 소프트웨어 '엔비디아 다이나모(Dynamo) 1.0'을 공개했다.

17일 업계에 따르면 다이나모 1.0는 'AI 공장을 위한 운영체제(OS)'다. 일반 컴퓨터에서 윈도우나 맥OS가 하드웨어와 각종 애플리케이션 사이에서 자원을 배분하고 조율하듯, 다이나모는 데이터센터 안에 있는 수많은 GPU와 메모리 자원을 유기적으로 조율해 AI 추론 작업이 가장 효율적으로 처리될 수 있도록 돕는 소프트웨어다.

쉽게 말해 엔진을 얼마나 잘 굴리느냐를 결정하는 제어 시스템이 다이나모인 셈이다.
엔비디아, 다이나모 프로덕션 단계 진입… AI 팩토리용 추론 운영 체제 공개. 사진=엔비디아

다이나모 1.0 소프트웨어가 필요한 이유는 AI 서비스가 실제 운영 환경으로 확산되면서 생기는 복잡성 때문이다. 에이전틱 AI 시스템은 동시에 수많은 요청을 처리해야 하는데, 요청의 규모나 종류가 예측 불가능하게 달라진다.

어떤 요청은 짧고 단순하고 어떤 요청은 긴 문맥을 기억하며 여러 단계로 이어진다. 이를 GPU에 효율적으로 배분하지 않으면 자원 낭비가 생기고 비용이 치솟는다.

다이나모는 여기서 '트래픽 제어' 역할을 맡아 이전 단계에서 생성된 관련 단기 메모리를 가장 많이 보유한 GPU로 요청을 자동 배분함으로써 불필요한 재연산을 줄인다.
엔비디아 블랙웰. 사진=엔비디아

실제 성과도 두드러진다. 최근 업계 벤치마크에서 다이나모는 엔비디아 블랙웰 GPU의 추론 성능을 최대 7배까지 향상시켰다. 같은 GPU로 7배 많은 일을 처리할 수 있다는 의미로, 토큰당 처리 비용이 그만큼 낮아진다. 엔비디아는 이를 무료 오픈소스로 공개해 진입 장벽을 낮췄다.

다이나모 1.0은 랭체인·vLLM·SG랭 등 이미 현장에서 널리 쓰이는 오픈소스 AI 프레임워크에 네이티브로 통합돼 기존 개발 환경을 크게 바꾸지 않아도 도입할 수 있다. 지능형 메모리 관리를 위한 KVBM, GPU 간 고속 데이터 이동을 위한 NIXL, 스케일링 간소화를 위한 엔비디아 그로브(Grove) 등 핵심 구성 요소를 독립 모듈 형태로도 제공한다.

채택 기업 면면도 화려하다. 아마존 웹 서비스(AWS)·마이크로소프트 애저·구글 클라우드·OCI 등 주요 클라우드 제공업체는 물론, AI 서비스 기업 커서(Cursor)·퍼플렉시티(Perplexity), 글로벌 기업 쿠팡·소프트뱅크·페이팔·핀터레스트·바이트댄스 등이 다이나모를 채택하거나 통합하고 있다. 다이나모 1.0은 이날부터 전 세계 개발자들에게 무료로 제공된다.

젠슨 황 엔비디아 창립자 겸 CEO는 "추론은 인텔리전스의 엔진으로 모든 쿼리, 에이전트, 애플리케이션을 구동한다"며 "엔비디아 다이나모를 통해 AI 팩토리를 위한 최초의 운영체제를 구축했다. 에이전틱 AI의 새로운 흐름이 이미 시작됐음을 보여주며, 엔비디아는 이를 전 세계적 규모에서 지원하고 있다"고 말했다.