[GTC 2026] 엔비디아, AI 팩토리 전용 '운영체제' 다이나모 1.0 공개…추론 성능 최대 7배 향상
엔비디아가 'GTC 2026'에서 대규모 AI 추론을 위한 오픈소스 소프트웨어 '엔비디아 다이나모(Dynamo) 1.0'을 공개했다.
17일 업계에 따르면 다이나모 1.0는 'AI 공장을 위한 운영체제(OS)'다. 일반 컴퓨터에서 윈도우나 맥OS가 하드웨어와 각종 애플리케이션 사이에서 자원을 배분하고 조율하듯, 다이나모는 데이터센터 안에 있는 수많은 GPU와 메모리 자원을 유기적으로 조율해 AI 추론 작업이 가장 효율적으로 처리될 수 있도록 돕는 소프트웨어다.

다이나모 1.0 소프트웨어가 필요한 이유는 AI 서비스가 실제 운영 환경으로 확산되면서 생기는 복잡성 때문이다. 에이전틱 AI 시스템은 동시에 수많은 요청을 처리해야 하는데, 요청의 규모나 종류가 예측 불가능하게 달라진다.
어떤 요청은 짧고 단순하고 어떤 요청은 긴 문맥을 기억하며 여러 단계로 이어진다. 이를 GPU에 효율적으로 배분하지 않으면 자원 낭비가 생기고 비용이 치솟는다.

실제 성과도 두드러진다. 최근 업계 벤치마크에서 다이나모는 엔비디아 블랙웰 GPU의 추론 성능을 최대 7배까지 향상시켰다. 같은 GPU로 7배 많은 일을 처리할 수 있다는 의미로, 토큰당 처리 비용이 그만큼 낮아진다. 엔비디아는 이를 무료 오픈소스로 공개해 진입 장벽을 낮췄다.
다이나모 1.0은 랭체인·vLLM·SG랭 등 이미 현장에서 널리 쓰이는 오픈소스 AI 프레임워크에 네이티브로 통합돼 기존 개발 환경을 크게 바꾸지 않아도 도입할 수 있다. 지능형 메모리 관리를 위한 KVBM, GPU 간 고속 데이터 이동을 위한 NIXL, 스케일링 간소화를 위한 엔비디아 그로브(Grove) 등 핵심 구성 요소를 독립 모듈 형태로도 제공한다.
채택 기업 면면도 화려하다. 아마존 웹 서비스(AWS)·마이크로소프트 애저·구글 클라우드·OCI 등 주요 클라우드 제공업체는 물론, AI 서비스 기업 커서(Cursor)·퍼플렉시티(Perplexity), 글로벌 기업 쿠팡·소프트뱅크·페이팔·핀터레스트·바이트댄스 등이 다이나모를 채택하거나 통합하고 있다. 다이나모 1.0은 이날부터 전 세계 개발자들에게 무료로 제공된다.
젠슨 황 엔비디아 창립자 겸 CEO는 "추론은 인텔리전스의 엔진으로 모든 쿼리, 에이전트, 애플리케이션을 구동한다"며 "엔비디아 다이나모를 통해 AI 팩토리를 위한 최초의 운영체제를 구축했다. 에이전틱 AI의 새로운 흐름이 이미 시작됐음을 보여주며, 엔비디아는 이를 전 세계적 규모에서 지원하고 있다"고 말했다.