NVIDIA lanzó Dynamo 1.0, un software de código abierto diseñado para gestionar la inferencia de inteligencia artificial —proceso de aplicar un modelo de IA entrenado para generar respuestas en tiempo real— a gran escala.
La plataforma opera junto con las GPU NVIDIA Blackwell y está disponible de forma gratuita para desarrolladores de todo el mundo.
En pruebas de rendimiento recientes, Dynamo aumentó el rendimiento de inferencia de las GPU NVIDIA Blackwell hasta 7 veces, reduciendo el costo por token —unidad mínima de procesamiento de texto en modelos de lenguaje— y ampliando las oportunidades de operación para millones de GPU.
Qué hace Dynamo 1.0
A medida que los sistemas de agentes de IA entran en producción en diversos sectores, escalar la inferencia dentro de un centro de datos se convirtió en un desafío de orquestación de recursos, con solicitudes de tamaños y modalidades variados que alcanzan picos impredecibles.
Dynamo 1.0 funciona como el sistema operativo distribuido de las fábricas de IA —centros de procesamiento masivo de modelos de inteligencia artificial—, orquestando de manera integrada los recursos de GPU y memoria en todo el clúster para dar soporte a cargas de trabajo complejas.
La plataforma distribuye el trabajo de inferencia entre las GPU, incorpora un control de tráfico inteligente y transfiere datos entre las GPU y almacenamientos de menor costo, lo que reduce el desperdicio de recursos y alivia las restricciones de memoria.
En el caso de la IA autónoma y las solicitudes largas, puede dirigir las solicitudes a las GPU que ya cuentan con la memoria contextual más relevante de las etapas anteriores y descargar esa memoria cuando ya no sea necesaria.
“La inferencia es el motor de la inteligencia, impulsando cada consulta, cada agente y cada aplicación”, señaló Jensen Huang, CEO y fundador de NVIDIA.
“Con NVIDIA Dynamo, hemos creado el primer sistema operativo de la historia para las fábricas de IA. La rápida adopción en todo nuestro ecosistema demuestra que esta nueva ola de IA agentiva ya está aquí”, agregó.
Marcio Aguiar, director de la división Enterprise de NVIDIA para América Latina, señaló que el avance “allana el camino para acelerar el desarrollo de aplicaciones en áreas como la robótica, la visión computacional y los sistemas autónomos, acercando cada vez más la IA a las operaciones reales de las empresas y la sociedad”.
Adopción global
Dynamo 1.0 cuenta con adopción en proveedores de servicios en la nube, empresas nativas de IA y corporaciones globales.
Entre los proveedores de nube figuran Amazon Web Services (AWS), Microsoft Azure, Google Cloud y Oracle Cloud Infrastructure (OCI).
Entre los socios de nube de NVIDIA se encuentran Alibaba Cloud, CoreWeave, Crusoe, DigitalOcean, Gcore, GMI Cloud, Lightning AI, Nebius, Nscale, Together AI y Vultr.
También adoptaron la plataforma empresas nativas de IA como Cursor, Hebbia y Perplexity; proveedores de inferencia como Baseten, Deep Infra y Fireworks; y corporaciones globales como AstraZeneca, BlackRock, ByteDance, Coupang, Instacart, Meituan, PayPal, Pinterest, Shopee y SoftBank Corp.
“A medida que la IA pasa de proyectos piloto a una producción continua a gran escala, la infraestructura subyacente debe ser tan dinámica como los modelos que soporta. La compatibilidad con NVIDIA Dynamo nos permite ofrecer un entorno más integrado y resistente para la implementación de agentes de IA complejos”, afirmó Chen Goldberg, vicepresidente ejecutivo de productos e ingeniería de CoreWeave.
“Ofrecer una inferencia de IA confiable a gran escala no se limita solo a GPU potentes, sino también al software que transforma ese rendimiento en resultados reales para los clientes. La pila de software de NVIDIA, desde Dynamo hasta TensorRT-LLM, proporciona una optimización profunda, un rendimiento predecible y un tiempo de implementación más rápido”, explicó Danila Shtan, CTO de Nebius.
“Ofrecer una experiencia de IA intuitiva y multimodal a cientos de millones de usuarios requiere inteligencia en tiempo real a escala global. Con NVIDIA Dynamo optimizando nuestra implementación, estamos ampliando las experiencias personalizadas que ofrecemos, impulsadas por una infraestructura de IA de alto rendimiento”, añadió Matt Madrigal, CTO de Pinterest.
Dynamo 1.0 ya está disponible para desarrolladores.
