NVIDIA Vera

專為代理 AI 打造的 CPU

概覽

專為全球 AI 工廠打造

NVIDIA Vera 專為代理 AI 與強化學習 (RL) 背後運作的 CPU 打造，相關任務涵蓋程式碼執行、工具使用、沙盒、分析、資料流程，以及超越模型的協調。Vera 既是用於加速系統的主機 CPU，也是用於 AI 工廠工作負載的獨立 CPU，可裨益 GPU 獲得充足資料、代理程式即時回應，並讓訓練循環持續運作。搭載高速且節能的 NVIDIA Olympus 核心與高頻寬 LPDDR5X 記憶體，Vera 的沙盒環境效能較傳統 CPU 基礎架構最高可提升 70%，協助 AI 工廠在每一塊錢的成本下產生更多 Token。

隆重推出 Vera，這是專為執行全球 AI 代理程式所打造的 CPU

NVIDIA 推出高效能的節能 NVIDIA Vera CPU，將推動各產業的多樣化工作負載，包括代理 AI、強化學習與資料處理。

閱讀新聞稿

Vera 正式登場：NVIDIA 首款專為代理程式打造的 CPU 已登陸頂尖 AI 實驗室

NVIDIA 超大規模與高效能運算部門 (HPC) 副總裁 Ian Buck 親手將首批 NVIDIA Vera CPU 系統交付給 Anthropic、OpenAI、Oracle Cloud Infrastructure 與 SpaceXAI，象徵代理式 CPU 已從發布邁入量產階段。

閱讀部落格文章

NVIDIA Vera CPU Rack

NVIDIA Vera CPU Rack 以 AI 工廠規模驅動強化學習與代理 AI。本身採用 NVIDIA MGX™ 架構，最多整合 256 顆 Vera CPU，可同時執行逾 22,500 個環境。

深入瞭解

產品特點

業界領先的 Agentic CPU 效能

代理式沙盒效能提升 1.8 倍

代理 AI 的效能受限於傳統 CPU 瓶頸。在代理程式的推理循環中，CPU 會查詢 SQLite 記憶體、編譯生成的程式碼、執行 Python 工具鏈，並利用 RegEx 解析輸出。NVIDIA Vera 可將所有五種工作負載加速至頂尖 x86 CPU 的 1.8 倍，大幅提升代理式內部循環，將 AI 工廠輸出最大化。

根據測量資料得出的相對效能，可能有所變更。NVIDIA Vera CPU 效能基準為 x86 CPU (AMD EPYC Turin)，涵蓋各種工作負載，包括程式碼編譯、解譯器、指令碼編寫、執行階段引擎、擷取、轉換與載入 (ETL)、資料分析與圖形。

根據測量資料得出的相對效能，可能有所變更。搭載 LPDDR5X 的 NVIDIA Vera CPU 在關鍵 CPU 記憶體效能指標方面，以搭載 DDR5 的 x86 CPU (AMD EPYC Turin) 為基準。

高頻寬的節能記憶體

傳統 DDR5 必須在頻寬、效率與可維護性之間取捨。NVIDIA Vera 結合 LPDDR5X 記憶體與 SOCAMM、可拆卸、可現場更換的模組，提供低功耗 (LP) 效率，以及伺服器級的靈活性與可升級的容量。其成果是相較於搭載 DDR5 的領先 x86 CPU，提供 2 倍記憶體頻寬、3 倍每核心頻寬，以及 4 倍能源效率，進一步提升超大規模與企業級 AI 工廠的產出能力。

使用案例

專為 AI 工廠設計

主機 CPU

NVIDIA Vera 作為 AI 工廠的主機 CPU，可提供系統層級的效率，並支援 NVIDIA Vera Rubin NVL72 與 HGX™ Vera Rubin NVL8 等平台。Vera 在為大規模 AI 提供 GPU 資料供應的同時，也負責維持工廠運作所需的 CPU 工作，包括 ETL、鍵值 (KV) 快取管理以及編排。憑藉出色的單執行緒效能、龐大的記憶體頻寬，以及避免跨 Chiplet 延遲的單一運算晶片設計，Vera 能提供穩定且可預測的效能，同時確保 GPU 在加速運算的 AI 與 HPC 系統中維持高利用率。

獨立型 CPU

針對代理 AI、強化學習、資料處理與分析工作，NVIDIA Vera 提供領先的每核心效能與超高記憶體頻寬，可同時執行數千個平行沙盒環境、工具呼叫、程式碼執行、評估迴圈及資料工作流程。更快的 CPU 執行速度代表代理等待時間更短、強化學習系統在每個訓練步驟中能產生更多回饋資料，而 AI 工廠也能在每一美元的成本下產出更多 Token。作為獨立 CPU 平台，Vera 同樣支援超大規模雲端、企業級及 HPC 工作負載，並可透過 NVIDIA Vera BlueField®-4 STX 延伸至儲存基礎架構。Vera 提供高密度液冷式 NVIDIA Vera CPU 機櫃方案，以及標準雙插槽與單插槽配置，可靈活部署於各類資料中心環境。

產品特點

探索技術突破

專為強化學習與代理 AI 的需求打造，NVIDIA Vera 結合自研 Olympus 核心、高頻寬 LPDDR5X 記憶體，以及低延遲 NVIDIA 可擴充連貫網狀架構 (SCF)。Vera 透過 NVIDIA NVLink™-C2C 連線、機密運算以及完整的 Arm® 相容性，可擴展至加速系統與現代化資料中心環境。本身的整合式運算架構確保軟體環境回應穩定、資料順暢流通，將 AI、分析與高效能運算工作負載的傳輸量、能源效率與 GPU 使用率極大化。

NVIDIA 自訂型 Olympus 核心

NVIDIA Vera 配備 88 個自訂型 Olympus 核心，專為代理 AI 與強化學習的重度控制、延遲敏感工作所打造。非凡的單執行緒效能有助於加速軟體環境、工具呼叫與評估循環的完成，而 NVIDIA 空間多執行緒功能則可建立 176 個執行緒，並透過分區核心資源，實現可預測的大規模傳輸量。

LPDDR5X 記憶體子系統

NVIDIA Vera 提供高達 1.2 TB/s 的 LPDDR5X 記憶體頻寬，造就 2 倍的頻寬，但功耗僅為傳統 CPU 記憶體的一半。這能讓成千上萬個並行軟體環境維持回應能力，同時支援更快速的 RL 迭代、高效的 KV 快取管理，以及資料密集型代理式工作流程。Vera 具備高達 1.5 TB 的記憶體，可為 AI 工廠、分析與高效能運算工作負載提供容量與效率。

第二代 NVIDIA SCF

NVIDIA Vera 採用第二代 NVIDIA SCF，於單一運算晶片上連結所有 88 個核心、快取、記憶體、輸入輸出 (IO) 以及 NVLink-C2C。SCF 具備 3.4 TB/s 的雙分段頻寬與統一快取架構，即使在 CPU 完全使用時，也能讓核心以快速又一致的方式存取資料。藉由避免跨晶片通訊，Vera 能在大規模代理 AI 工作負載、資料分析以及 AI 工廠基礎架構中，維持可預測的延遲與傳輸量表現。

NVIDIA NVLink-C2C

NVIDIA NVLink-C2C 可在 Vera CPU 與 NVIDIA GPU 之間提供高達 1.8 TB/s 的一致性頻寬。當 Vera 搭配 NVIDIA Rubin GPU 使用時，可建構統一記憶體架構，讓 CPU 與 GPU 能更有效率地協同處理複雜的 AI 與 HPC 工作負載、大型資料集，以及 KV 快取卸載作業。NVLink-C2C 可減少資料傳輸瓶頸、簡化效能最佳化流程、支援敏感資料與程式碼的安全隔離，並為雙插槽 Vera CPU 系統提供高速互連能力。

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 整合 NVIDIA 的尖端技術，包括 72 顆 Rubin GPU、36 顆 Vera CPU、ConnectX®-9 SuperNIC 與 BlueField-4 DPU。它透過搭載 NVLink 6 交換器的機架級平台擴充智慧，並藉由 NVIDIA Quantum-X800 InfiniBand 與 Spectrum-X™ 乙太網路橫��擴充，驅動 AI 工業革命。