Plateforme NVIDIA Vera Rubin

Infrastructure d'IA pour l'ère des agents.

Aperçu

Propulser l'ère de l'IA agentique

La plateforme NVIDIA Vera Rubin est conçue pour l'ère de l'IA agentique et du raisonnement, et elle est pensée pour maîtriser la résolution de problèmes en plusieurs étapes et les workflows massifs à long contexte à grande échelle. Vera Rubin est un système multi-rack à l'échelle du POD qui regroupe cinq systèmes spécialement conçus à l'échelle du rack en un seul supercalculateur d'IA massif et cohérent. En éliminant les principaux goulets d'étranglement en matière de communication et de transfert de mémoire, la plateforme stimule l'inférence, ce qui permet de générer plus de jetons par watt et d'un coût par jeton plus faible par rapport à l'architecture NVIDIA Blackwell.

NVIDIA Vera Rubin passe à la pleine production pour alimenter les usines d’IA agentique du monde entier

Le NVIDIA Vera Rubin passe à la pleine production, avec les principaux fabricants de serveurs de Taïwan et les leaders mondiaux de la chaîne logistique qui fabriquent et expédient à grande échelle des systèmes basés sur Vera Rubin, alimentant ainsi les laboratoires d’IA, les fournisseurs de Cloud et les hyperscalers qui se préparent à construire l’intelligence de demain.

Lire le communiqué de presse

NVIDIA Vera Rubin inaugure la prochaine avancée en matière d'IA

La plateforme NVIDIA Vera Rubin comprend sept nouvelles puces en pleine production pour mettre à l'échelle les plus grandes usines d'IA au monde.

Lire le communiqué de presse

Découvrez la plateforme Vera Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifie les technologies de pointe de NVIDIA, notamment 72 GPU Rubin, 36 CPU Vera, les SuperNIC ConnectX™-9 et les DPU BlueField™-4. Il augmente l'intelligence dans une plateforme à l'échelle du rack de troisième génération grâce au commutateur NVIDIA NVLink™ 6, puis s'étend avec NVIDIA Quantum-X800 InfiniBand et Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA à grande échelle.

Vera Rubin NVL72 comprend un nouveau Transformer Engine avec compression adaptative pour augmenter les performances d'inférence NVFP4, la technologie NVIDIA Confidential Computing de troisième génération qui étend la sécurité à l'ensemble de la plateforme à l'échelle du rack, ainsi qu'un moteur RAS de deuxième génération qui offre une résilience à l'échelle du rack.

En savoir plus sur NVIDIA Vera Rubin NVL72

CPU NVIDIA Vera

Le rack de CPU NVIDIA Vera fournit une infrastructure CPU dense à refroidissement liquide spécialement conçue pour l'apprentissage par renforcement et l'IA agentique à grande échelle. Basé sur l'architecture de référence modulaire NVIDIA MGX, chaque rack intègre 256 CPU NVIDIA Vera et prend en charge plus de 22 500 environnements sandbox simultanés, ce qui permet aux usines d'IA de disposer d'une capacité CPU évolutive et écoénergétique pour les appels d'outils, l'évaluation, le traitement des données et l'orchestration.

En savoir plus sur le CPU NVIDIA Vera

NVIDIA Groq 3 LPX

Accélérateur d'inférence pour NVIDIA Vera Rubin, le matériel NVIDIA Groq 3 LPX a été conçu pour répondre aux exigences de faible latence et de large contexte des systèmes agentiques. En combinant les GPU Rubin pour la mémoire à bande passante élevée (HBM) et les LPU pour la mémoire statique à accès aléatoire (SRAM), NVIDIA Vera Rubin avec LPX propose une nouvelle classe de performances d'inférence pour les modèles dotés d'un billion de paramètres avec un contexte d'un million de jetons.

En savoir plus sur NVIDIA Groq 3 LPX

NVIDIA Vera BlueField-4 STX

NVIDIA Vera BlueField-4 STX est une base modulaire pour les solutions de stockage natives de l'IA à l'échelle du rack. En intégrant NVIDIA Vera Rubin, le processeur de stockage BlueField-4 STX, la mise en réseau Spectrum-X et le logiciel d'IA de NVIDIA, cette solution optimise l'ensemble du cycle de vie des données, de l'analyse des données à l'entraînement des modèles en passant par les workflows d'IA agentique complets à grande échelle.

En savoir plus sur NVIDIA Vera BlueField-4 STX

NVIDIA Spectrum-6 SPX Ethernet

Spectrum-6 SPX Ethernet est conçu pour accélérer la mise en réseau des usines d'IA. Configurable avec des commutateurs NVIDIA Spectrum-X™ Ethernet ou NVIDIA Quantum-X800 InfiniBand, il fournit une connectivité rack-to-rack à faible latence et à haut débit à grande échelle.

En savoir plus sur la photonique NVIDIA Spectrum-X Ethernet

Explorer les produits NVIDIA Vera Rubin

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX™ Vera Rubin NVL72 fournit aux entreprises une solution d'infrastructure d'IA clé en main et prête à l'emploi, basée sur la plateforme NVIDIA Vera Rubin. Il est spécialement conçu pour un déploiement à grande échelle afin d'accélérer les modèles d'IA les plus complexes.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 est un système d'IA à refroidissement liquide alimenté par huit GPU NVIDIA Rubin et NVLink de sixième génération. Il est spécialement conçu pour accélérer l'entraînement, l'inférence et le post-entraînement pour chaque charge de travail d'IA.

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8 intègre huit GPU NVIDIA Rubin avec des interconnexions NVLink de sixième génération à haute vitesse pour propulser le Data Center dans une nouvelle ère de calcul accéléré et d'IA générative. NVIDIA HGX Rubin NVL8 peut être associé à des CPU NVIDIA Vera ou à des cartes de base CPU basées sur x86.

NVIDIA Vera Rubin NVL4

NVIDIA Vera Rubin NVL4 permet l'automatisation des découvertes scientifiques et l'IA agentique grâce à un pont qui connecte quatre GPU NVIDIA Rubin à deux CPU NVIDIA Vera via NVLink-C2C. Compatible avec les serveurs NVIDIA MGX à refroidissement liquide, il offre des performances jusqu'à 4 fois plus élevées que Hopper pour les simulations scientifiques, 6 fois plus élevées que Hopper pour l'entraînement à l'IA au service de la science et 8 fois plus élevées que Hopper pour l'inférence.

À l'intérieur de la plateforme NVIDIA Vera Rubin

Lisez cette étude technique approfondie pour découvrir comment NVIDIA Vera Rubin traite le centre de données comme l'unité de calcul, et non la puce, établissant ainsi une nouvelle base pour produire de l'intelligence de manière efficace, sécurisée et prévisible à grande échelle.

Lire l'article technique