La fondation de l'entraînement et de l'inférence de l'IA à l'échelle giga.
En raison de la convergence des lois de pré-entraînement, de post-entraînement et de mise à l'échelle du temps d'inférence, les centres de données modernes sont confrontés à des problèmes de performance et d'efficacité lorsqu'ils tentent de prendre en charge des modèles qui nécessitent des chaînes de pensée complexes et en plusieurs étapes.
Spécialement conçue pour relever ces défis, NVIDIA DGX™ Vera Rubin NVL72 est une solution d'infrastructure d'IA clé en main qui offre des performances de pointe tout en améliorant considérablement l'efficacité énergétique. DGX Vera Rubin NVL72 offre des performances de pointe par watt et par jetons par watt pour n'importe quelle charge de travail, ce qui permet aux entreprises de faire évoluer considérablement l'intelligence tout en améliorant l'économie des jetons.
DGX Vera Rubin NVL72 associe le CPU NVIDIA Vera à haute efficacité énergétique à des GPU NVIDIA Rubin afin de fournir des performances de pointe par watt. Les entreprises peuvent ainsi faire évoluer l'entraînement et l'inférence en long contexte dans le cadre de leur empreinte énergétique existante, transformant ainsi le centre de données en un moteur à haute efficacité énergétique pour l'innovation en matière d'IA.
NVIDIA DGX SuperPOD™ avec les systèmes DGX Vera Rubin NVL72 élimine les conjectures liées au déploiement d'une infrastructure d'IA à grande échelle. Grâce à une architecture de baies simple et facile à déployer, elle est conçue pour tirer parti des dernières avancées en matière d'ingénierie de centre de données.
NVIDIA Mission Control™ accélère chaque aspect des opérations, de la configuration de DGX Vera Rubin NVL72 à l'intégration des installations, en passant par la gestion des grappes et des charges de travail. Grâce à des logiciels intelligents et intégrés, les entreprises contrôlent les événements de refroidissement et d'alimentation pour redéfinir la résilience de l'infrastructure.
La plateforme NVIDIA DGX a été conçue dès le départ pour l'IA d'entreprise. Elle inclut NVIDIA DGX SuperPOD et combine le meilleur des logiciels, de l'infrastructure et de l'expertise de NVIDIA dans une solution de développement de l'IA moderne et unifiée.
| GPU et CPU | GPU NVIDIA Rubin 72x, CPU NVIDIA Vera 36x |
| Mémoire GPU totale | Bande passante | 20,7 To | Jusqu'à 1 580 To/s |
| Mémoire rapide totale | 75 To |
| Performances | Inférence NVFP4 : 3 600 PFlops Entraînement NVFP4 : 2 520 PFlops* Entraînement FP8/FP6 : 1 260 PFlops* |
| Mise en réseau | > OSFP à un seul port NVIDIA® 144x ConnectX®-9 VPI avec NVIDIA InfiniBand et Ethernet à 800 Gbit/s > NVIDIA BlueField®-4 VPI 18x à double port avec NVIDIA InfiniBand et Ethernet à 400 Gbit/s |
| Système NVIDIA NVLink™ Switch | 9 commutateurs NVIDIA NVLink L1 |
| Réseau de gestion | Contrôleur BMC hôte avec RJ45 |
| Logiciel | NVIDIA Mission Control, NVIDIA AI Enterprise, NVIDIA DGX OS |
| Assistance d'entreprise | Trois ans d'assistance commerciale standard pour le matériel et les logiciels d'entreprise |
Spécifications sujettes à modification.
* Spécification dense.
Discutez avec un expert NVIDIA à propos de NVIDIA DGX Vera Rubin NVL72.
Découvrez pourquoi NVIDIA DGX est la norme éprouvée sur laquelle l'IA d'entreprise est construite.
Libérez le plein potentiel de l'IA grâce à des options de déploiement flexibles, de solutions sur site à des solutions hébergées.