A base para treinamento e inferência de IA em gigaescala.
Com a convergência das leis de pré-treinamento, pós-treinamento e escalabilidade de tempo de inferência, os data centers modernos enfrentam gargalos de desempenho e eficiência ao tentar suportar modelos que exigem cadeias de pensamento complexas e com várias etapas.
Criado especificamente para enfrentar esses desafios, o NVIDIA DGX™ Vera Rubin NVL72 é uma solução de infraestrutura de IA pronta para uso que oferece desempenho de ponta, melhorando consideravelmente a eficiência energética. O DGX Vera Rubin NVL72 oferece o maior desempenho por watt, e tokens por watt, do setor para qualquer carga de trabalho de IA, permitindo que as empresas expandam significativamente a inteligência e melhorem a economia de tokens.
O DGX Vera Rubin NVL72 combina a CPU NVIDIA Vera com eficiência energética com as GPUs NVIDIA Rubin para oferecer um desempenho por watt de ponta. Isso permite que as empresas escalem o treinamento e a inferência de longo contexto dentro de sua pegada de energia existente, transformando o data center em um mecanismo de eficiência energética para inovação em IA.
O NVIDIA DGX SuperPOD™ com sistemas DGX Vera Rubin NVL72 elimina as suposições da implantação de infraestrutura de IA em larga escala. Com uma arquitetura de rack simples e fácil de implantar, ele foi projetado para usar os avanços mais recentes em engenharia de data center.
O NVIDIA Mission Control™ acelera todos os aspectos das operações, desde a configuração do DGX Vera Rubin NVL72 até a integração com instalações e o gerenciamento de clusters e cargas de trabalho. Habilitadas por software inteligente e integrado, as empresas ganham controle sobre os eventos de resfriamento e energia para redefinir a resiliência da infraestrutura.
Criada desde o início para IA empresarial, a plataforma NVIDIA DGX, com o NVIDIA DGX SuperPOD, combina o melhor do software, da infraestrutura e da experiência da NVIDIA em uma solução de desenvolvimento de IA moderna e unificada.
| GPU | 72 GPUs NVIDIA Rubin, 36 CPUs NVIDIA Vera |
| Memória da GPU Total | Largura de banda | 20,7 TB | Até 1,580 TB/s |
| Memória total rápida | 75 TB |
| Desempenho | NVFP4 Inference: 3,600 PFLOPS NVFP4 Training: 2,520 PFLOPS FP8/FP6 Training: 1,260 PFLOPS |
| Redes | > 144x OSFP single-port NVIDIA® ConnectX®-9 VPI com 800 Gb/s NVIDIA InfiniBand e Ethernet > 18x dual-port NVIDIA BlueField®-4 VPI com 400 Gb/s NVIDIA InfiniBand e Ethernet |
| Sistema de Switches NVIDIA NVLink™ | 9 Unidades de Switches NVIDIA NVLink L1 |
| Rede de gerenciamento | Controlador de gerenciamento da baseboard host (BMC) com RJ45 |
| Software | NVIDIA Mission Control, IA da NVIDIA Enterprise, NVIDIA DGX OS |
| Suporte Empresarial | Três anos de suporte de alto nível para empresas, para hardware e software |
Specifications subject to change
Fale com um especialista da NVIDIA sobre o NVIDIA DGX Vera Rubin NVL72.
Saiba por que o NVIDIA DGX é o padrão comprovado no qual a IA empresarial é construída.
Libere todo o potencial da IA com opções de implantação flexíveis, de soluções locais a soluções hospedadas.