NVIDIA Vera Rubin NVL72

エージェント型 AI の次なるフロンティアを構築します。

概要

7 つの新しいチップ、1 つの AI スーパーコンピューター

NVIDIA Vera Rubin NVL72 は、72 基の Rubin GPU、36 基の Vera CPU、ConnectX®-9 SuperNIC™、BlueField®-4 DPU など、NVIDIA の最先端テクノロジを統合しています。これは、NVIDIA NVLink™ 6 スイッチを搭載したラックスケールプラットフォームでインテリジェンスをスケールアップし、NVIDIA Quantum-X800 InfiniBand と Spectrum-X™ イーサネットでスケールアウトすることで、大規模な AI 産業革命を推進します。NVIDIA Groq 3 LPX ラックと共に導入すれば、Vera Rubin NVL72 は兆パラメーターモデルと数百万トークンのコンテキストに対して新たなクラスの推論パフォーマンスを実現します。

第 3 世代 NVIDIA MGX™ NVL72 ラック設計を基盤に構築された Vera Rubin NVL72 は、前世代からのシームレスな移行を実現します。NVIDIA Blackwell と比較して、4 分の 1 の GPU で AI トレーニングを行い、100 万トークンあたり 10 分の 1 のコストで AI 推論を実現します。ケーブルレスのモジュラートレイ設計と 80 社を超える MGX エコシステムパートナーから提供されるサポートを備え、このラックスケール AI スーパーコンピューターは、世界標準のパフォーマンスと迅速な展開を実現します。

NVIDIA Vera Rubin が本格生産を開始し、世界中のエージェント型 AI ファクトリーを強化

NVIDIA Vera Rubin は本格的な量産体制に入っています。台湾の大手サーバーメーカーやグローバルサプライチェーンリーダーが Vera Rubin ベースのシステムを大規模に製造および出荷し、AI ラボ、クラウドプロバイダー、ハイパースケーラーが明日のインテリジェンスを構築できるよう支援します。

プレスリリースを読む

NVIDIA Vera Rubin がエージェント型 AI のフロンティアを切り開く

NVIDIA Vera Rubin プラットフォームは、世界最大の AI ファクトリーの拡張のために、現在フル生産中の新しい 7 つのチップを提供します。

プレスリリースを読む

パフォーマンス

AI 推論とトレーニングの効率性が飛躍的に向上

LLM 推論パフォーマンスは変更される場合があります。 32K/8K ISL/OSL を使用した Kimi-K2-Thinking モデルに基づく 100 万トークンあたりのコストを、NVIDIA GB200 NVL72 と NVIDIA Vera Rubin NVL72 を比較したものです。

推論コストの削減

NVIDIA Vera Rubin NVL72 は、NVIDIA GB200 NVL72 と比較して、高度にインタラクティブで深層リーズニング型のエージェント型 AI において 100 万トークンあたりのコストを 10 分の 1 に抑えます。

AI ファクトリーのスループットを最大化

NVIDIA Vera Rubin NVL72 は、NVIDIA GB200 NVL72 と比較して、メガワットあたりで最大 10 倍のトークン数を実現し、同じ電力フットプリント内でインテリジェンスを拡張できます。

LLM 推論パフォーマンスは変更される場合があります。 NVIDIA GB200 NVL72 と NVIDIA Vera Rubin NVL72 を比較した 32K/8K ISL/OSL を使用した Kimi-K2 思考モデルに基づく MW あたり 1 秒あたりのトークン数。

パフォーマンスの予測値は変更される場合があります。NVIDIA GB200 NVL72 と NVIDIA Vera Rubin NVL72 を比較し、1 か月間の固定期間内に 100T トークンでトレーニングされた 10T MoE モデルを基盤とする GPU の数。

トレーニングの効率性を向上

NVIDIA Vera Rubin NVL72 は、NVIDIA GB200 NVL72 と比較して 4 分の 1 の GPU 数で混合エキスパート (MoE) モデルをトレーニングします。

兆単位パラメーター級モデルのスループットが 35 倍向上

エージェント型システムは、従来の AI アプリケーションと比較して、最大 15 倍のトークンを処理します。 AI ファクトリーは、低遅延と高い経済効率を維持しながら、大量のトークン処理と大規模なコンテキストウィンドウに対応する必要があります。 LPX と組み合わせることで、Vera Rubin NVL72 は、1 兆パラメーター級モデルにおいて、メガワットあたり最大 35 倍のスループットを実現します。

予測されるパフォーマンスは変更される可能性があります。無料プラン ($0): Qwen-3 (パラメーター数 2,350 億、KV キャッシュトークン数 32,000）。ミディアムプラン ($3): Kimi K2.5 (パラメーター数 1 兆、KV キャッシュトークン数 128,000。ハイプラン ($6): GPT-MoE (2 兆パラメーターモデル、KV キャッシュトークン数 128,000)。プレミアムプラン ($45) およびウルトラプラン ($150) : GPT-MoE (2 兆パラメーターモデル、KV キャッシュトークン数 400,000)。

AI エージェントの時代を推進

Vera Rubin プラットフォームの内部

NVIDIA Rubin GPU

次世代 AI 向けに設計された、HBM4 搭載の Rubin GPU と第 3 世代 Transformer Engine。

詳細を見る

NVIDIA Vera CPU

Vera CPU は、データ移動とエージェント型推論向けに開発され、確定的なパフォーマンスを備えた高帯域幅でエネルギー効率に優れたコンピューティングを提供します。

詳細を見る

NVIDIA NVLink 6 スイッチ

NVLink 6 スイッチは、GPU あたり 3.6 テラバイト/秒 (TB/s) の全対全スケールアップ帯域幅を備え、AI 向けの高速 GPU 間通信を可能にします。

詳細を見る

NVIDIA ConnectX-9 SuperNIC

ConnectX‑9 SuperNIC は、PCIe Gen6 を介して GPU あたり 1.6 テラビット/秒 (Tb/s) の帯域幅を提供し、低レイテンシの大規模な GPU ダイレクトネットワーキングを実現するプログラマブルリモートダイレクトメモリアクセス (RDMA) を備えています。

詳細を見る

NVIDIA BlueField-4 DPU

BlueField-4 DPU は、AI ファクトリーにおけるストレージ、ネットワーク、サイバーセキュリティ、弾力的なスケーリングにまたがるデータ処理を高速化します。

詳細を見る

コパッケージドオプティクスを備えた NVIDIA Spectrum-X イーサネット

シリコンフォトニクスを統合した Spectrum‑X イーサネットスケールアウトスイッチは、プラグイン式トランシーバーを搭載した従来のネットワークと比較して、5 倍の電力効率、10 倍のネットワーク回復性、最大 5 倍のアップタイムを実現します。

詳細を見る

NVIDIA Groq 3 LPU

これは、エージェント型システムの低レイテンシと大規模コンテキストの要件を満たすように設計された、NVIDIA Vera Rubin NVL72 向けの推論アクセラレーターです。NVIDIA Groq 3 LPX ラックは、256 基の LPU、128GB SRAM、40 PB/s メモリ帯域幅、ラックあたり 640 TB/s スケールアップ帯域幅を備えています。Vera Rubin NVL72 と共同設計されており、Blackwell と比較して兆パラメーターモデルに対してワットあたり 35 倍の推論パフォーマンスと最大 10 倍の収益機会を提供します。

詳細を見る

仕様¹