NVIDIA NVLink Fusion

業界で実績のある AI スケールアップ パフォーマンスとラック スケール アーキテクチャを備えたセミカスタム AI インフラ。

概要

NVLink Fusion を使用したセミカスタム AI ファクトリー

NVIDIA NVLink™ Fusion は、ハイパースケーラーや AI ネイティブが 世界をリードする NVIDIA の AI インフラ プラットフォームにカスタム XPU や CPU をデプロイできるようにする、高帯域幅かつ低遅延の接続テクノロジーと IP です。NVIDIA の実績のあるスケールアップとスケールアウト テクノロジ スタックとエコシステム、および MGX™ ラック スケール アーキテクチャを活用することで、セミカスタム AI ファクトリーの開発の複雑さを軽減し、パフォーマンスを向上させ、市場投入までの時間を高速化します。単一の統合アーキテクチャ上で標準化することで、NVLink Fusion はデータ センター全体の運用を簡素化し、データセンター容量の柔軟な再プロビジョニングを可能にし、カスタム XPU が GPU とシームレスに統合されて異種コンピューティングを実現します。

AWS、Trainium4 のデプロイに向けて AI インフラを NVIDIA NVLink Fusion と統合

AWS が、NVLink Fusion を使用して Trainium4 のデプロイを高速化している方法をご覧ください。

NVIDIA NVLink Fusion によるラック スケール アーキテクチャへのセミカスタム コンピューティングの統合

NVIDIA NVLink Fusion を活用することで、ハイパースケーラーがセミカスタム AI インフラを構築し、ASIC または CPU と NVIDIA GPU を統合しながら、スケーラブルな単一のハードウェア インフラで標準化する方法をご覧ください。

NVLink Fusion を使用することで、高性能 AI ファクトリーを迅速に拡張し、NVIDIA ラック スケール アーキテクチャを構成するすべてのソリューション コンポーネントの恩恵が受けられるようになります。

利点

NVLink Fusion の利点

世界最高水準のスケールアップ パフォーマンス

AI ファクトリーの可能性を最大限に引き出すには、すべてのアクセラレーター間の迅速かつシームレスな通信が必要です。 NVIDIA NVLink 6 は、XPU あたり 3.6 TB/s で 72 基の XPU を全対全接続することができ、将来的には最大 1,152 のドメイン サイズを含むロードマップ構成により、AI パフォーマンスと投資収益率を向上させます。

実証済みのテクノロジ エコシステムとサプライ チェーン

XPU 設計パートナー、CPU パートナー、IP サプライヤーを含む包括的な NVLink Fusion テクノロジ エコシステムは、ハイパースケーラーと AI ネイティブが XPU 設計を最適化し、開発を効率化するのを支援します。MGX エコシステムは、包括的なラック スケールのアーキテクチャを提供し、採用企業のハイパースケーラーを NVIDIA が独自の MGX ベース システムに使用しているのと同じ実績のあるサプライ チェーンに接続することで、新しいラック設計やサプライヤー管理の複雑さを排除し、市場投入までの時間を高速化します。

柔軟な再プロビジョニングとデプロイのリスク軽減

MGX ラック アーキテクチャを採用する主な利点は、XPU と GPU ベースのシステム (Vera Rubin NVL72 など) を同じデータ センターに簡単に設計でき、同じラックとラック フットプリント、ネットワーク、冷却、電力供給、管理システムを共有できることです。 この統合されたアプローチにより、NVLink Fusion の採用企業は、データ センターの設計と構築をシリコンの準備や供給から切り離すことができ、ニーズの進化に応じて、XPU または GPU ベースのシステムの異なる組み合わせでデータ センターの容量を簡単に再プロビジョニングできるようになります。

異種 AI インフラ向けの統合アーキテクチャ

NVLink Fusion の採用企業は、分散推論やその他の非対称ワークロード向けの異種コンピューティングのために、同一データ センターに異なるタイプの XPU (または XPU と GPU) をデプロイできます。

その結果は、1 つの企業が単独で構築することはできない、単一のセミカスタム AI ファクトリーです。

プラットフォーム

NVIDIA NVLink Fusion のテクノロジ

NVIDIA NVLink

NVIDIA NVLink 6 と NVLink Switch チップは、単一の 72 アクセラレーター NVLink ドメイン (NVL72) で 260 TB/s の帯域幅を実現し、NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8 サポートにより、4 倍の帯域幅効率を実現します。

NVIDIA NVLink-C2C

NVIDIA NVLink-C2C は、業界最高水準の NVLink テクノロジをチップ間インターコネクトに拡張します。これにより、NVIDIA パートナーとの協業によりチップレットを通じて構築される新しいクラスの統合製品の開発が可能になり、NVIDIA GPU や CPU がカスタム シリコンと高帯域幅なコヒーレント接続を持てるようになります。

AI インフラ プラットフォーム

NVIDIA は、AI ワークフローの最適化と AI インフラの管理のための NVIDIA GPU、NVIDIA Vera CPU、コパッケージド オプティクス (CPO) スイッチ、ConnectX® SuperNICs™、BlueField® DPU、および Mission Control™ ソフトウェアを含む、AI ファクトリー テクノロジのモジュラー ポートフォリオを提供しています。

フルラックのソリューションは、セミカスタム AI ファクトリー統合のためにも利用可能です。これには、分離推論のために XPU ベースのシステムと混合できる Vera Rubin NVL72 ラック、エージェント型 AI システムと強化学習をサポートする Vera CPU ラック、高コンテキストと低遅延の推論を支援する NVIDIA LPX ラック、AI ネイティブ ストレージ向け NVIDIA STX ラック、およびスケールアウト ネットワーク向け NVIDIA SPX ラックが含まれます。

採用した企業

NVLink Fusion エコシステム

NVLink Fusion による AI 推論パフォーマンスの拡張

NVIDIA NVLink Fusion が、複雑な AI モデルの増大する要求に対応する方法をご覧ください。