Infrastructure d'IA pour l'ère des agents.
Aperçu
La plateforme NVIDIA Vera Rubin est conçue pour l'ère de l'IA agentique et du raisonnement, et elle est pensée pour maîtriser la résolution de problèmes en plusieurs étapes et les workflows massifs à long contexte à grande échelle. Vera Rubin est un système multi-rack à l'échelle du POD qui regroupe cinq systèmes spécialement conçus à l'échelle du rack en un seul supercalculateur d'IA massif et cohérent. En éliminant les principaux goulets d'étranglement en matière de communication et de transfert de mémoire, la plateforme stimule l'inférence, ce qui permet de générer plus de jetons par watt et d'un coût par jeton plus faible par rapport à l'architecture NVIDIA Blackwell.
NVIDIA Vera Rubin NVL72 unifie les technologies de pointe de NVIDIA, notamment 72 GPU Rubin, 36 CPU Vera, les SuperNIC ConnectX™-9 et les DPU BlueField™-4. Il augmente l'intelligence dans une plateforme à l'échelle du rack de troisième génération grâce au commutateur NVIDIA NVLink™ 6, puis s'étend avec NVIDIA Quantum-X800 InfiniBand et Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA à grande échelle.
Vera Rubin NVL72 comprend un nouveau Transformer Engine avec compression adaptative pour augmenter les performances d'inférence NVFP4, la technologie NVIDIA Confidential Computing de troisième génération qui étend la sécurité à l'ensemble de la plateforme à l'échelle du rack, ainsi qu'un moteur RAS de deuxième génération qui offre une résilience à l'échelle du rack.
Le rack de CPU NVIDIA Vera fournit une infrastructure CPU dense à refroidissement liquide spécialement conçue pour l'apprentissage par renforcement et l'IA agentique à grande échelle. Basé sur l'architecture de référence modulaire NVIDIA MGX, chaque rack intègre 256 CPU NVIDIA Vera et prend en charge plus de 22 500 environnements sandbox simultanés, ce qui permet aux usines d'IA de disposer d'une capacité CPU évolutive et écoénergétique pour les appels d'outils, l'évaluation, le traitement des données et l'orchestration.
Accélérateur d'inférence pour NVIDIA Vera Rubin, le matériel NVIDIA Groq 3 LPX a été conçu pour répondre aux exigences de faible latence et de large contexte des systèmes agentiques. En combinant les GPU Rubin pour la mémoire à bande passante élevée (HBM) et les LPU pour la mémoire statique à accès aléatoire (SRAM), NVIDIA Vera Rubin avec LPX propose une nouvelle classe de performances d'inférence pour les modèles dotés d'un billion de paramètres avec un contexte d'un million de jetons.
NVIDIA Vera BlueField-4 STX est une base modulaire pour les solutions de stockage natives de l'IA à l'échelle du rack. En intégrant NVIDIA Vera Rubin, le processeur de stockage BlueField-4 STX, la mise en réseau Spectrum-X et le logiciel d'IA de NVIDIA, cette solution optimise l'ensemble du cycle de vie des données, de l'analyse des données à l'entraînement des modèles en passant par les workflows d'IA agentique complets à grande échelle.
Spectrum-6 SPX Ethernet est conçu pour accélérer la mise en réseau des usines d'IA. Configurable avec des commutateurs NVIDIA Spectrum-X™ Ethernet ou NVIDIA Quantum-X800 InfiniBand, il fournit une connectivité rack-to-rack à faible latence et à haut débit à grande échelle.
Lisez cette étude technique approfondie pour découvrir comment NVIDIA Vera Rubin traite le centre de données comme l'unité de calcul, et non la puce, établissant ainsi une nouvelle base pour produire de l'intelligence de manière efficace, sécurisée et prévisible à grande échelle.