NVIDIA Vera

La CPU per l'era dell'IA.

Panoramica

Progettati per le fabbriche IA del mondo

NVIDIA Vera è progettata per il lavoro della CPU dietro l'IA agentica e l'apprendimento per rinforzo (RL), tra cui l'esecuzione di codice, l'uso degli strumenti, il sandboxing, l'analisi, le pipeline di dati e l'orchestrazione oltre il modello. Sia come CPU host per i sistemi accelerati che come CPU autonoma per i carichi di lavoro delle fabbriche IA, Vera mantiene le GPU alimentate, gli agenti reattivi e i loop di addestramento in movimento. Con core NVIDIA Olympus veloci e ad alta efficienza energetica e memoria LPDDR5X ad alta larghezza di banda, Vera offre prestazioni in ambiente sandbox fino all'80% più veloci rispetto all'infrastruttura CPU tradizionale, aiutando le fabbriche IA a generare più token per dollaro.

NVIDIA presenta Vera, la CPU per gli agenti

NVIDIA ha lanciato CPU NVIDIA Vera ad alte prestazioni e ad alta efficienza energetica per guidare diversi carichi di lavoro nei settori, tra cui l'IA agentica, l'apprendimento per rinforzo e l'elaborazione dei dati.

Leggi il comunicato stampa

Arriva Vera: la prima CPU di NVIDIA progettata per gli agenti approda nei migliori laboratori IA

Ian Buck, VP NVIDIA del calcolo iperscalabile e ad alte prestazioni (HPC), ha consegnato a mano i primi sistemi CPU NVIDIA Vera ad Anthropic, OpenAI, Oracle Cloud Infrastructure e SpaceXAI, segnando il momento in cui le CPU agentiche sono passate dall'annuncio alla produzione.

Leggi il blog

Rack CPU NVIDIA Vera

Il rack CPU NVIDIA Vera alimenta l'apprendimento per rinforzo e l'IA per agenti su scala IA industriale. Basato su NVIDIA MGX™, integra fino a 256 CPU Vera per eseguire oltre 22,5K ambienti simultanei.

Scopri di più

In evidenza

Prestazioni della CPU per carichi di lavoro agentici leader del settore

Prestazioni sandbox agentiche 1,8 volte più veloci

L'IA agentica è limitata dalle CPU tradizionali. Nel loop di ragionamento di un agente, la CPU compila il codice generato, esegue catene di strumenti Python e analizza il codice del software. NVIDIA Vera accelera tutti e tre i carichi di lavoro fino a 1,8 volte rispetto alle principali CPU x86, potenziando il loop interno agentico per massimizzare l'output delle fabbriche IA.

Prestazioni relative basate su dati misurati e soggette a modifiche. CPU NVIDIA Vera con prestazioni LPDDR5X confrontate con la CPU x86 di ultima generazione.

Prestazioni relative basate su dati misurati e soggette a modifiche. Contronto tra CPU NVIDIA Vera con prestazioni LPDDR5X e CPU x86 di ultima generazione con DDR5 nelle principali metriche delle prestazioni di memoria CPU.

Memoria ad alta larghezza di banda e ad alta efficienza energetica

La DDR5 tradizionale forza un compromesso tra larghezza di banda, efficienza e manutenzione. NVIDIA Vera abbina la memoria LPDDR5X a SOCAMM, moduli staccabili e sostituibili sul campo che offrono efficienza a bassa potenza (LP) con flessibilità di livello server e capacità aggiornabile. Il risultato è 2 volte la larghezza di banda, 3 volte la larghezza di banda per core e 4 volte l'efficienza energetica delle principali CPU x86 con DDR5, sbloccando un maggiore output delle fabbriche IA su iperscala e su scala aziendale.

Casi d'uso

Progettate per le fabbriche IA

CPU host

NVIDIA Vera offre efficienza a livello di sistema come CPU host per le fabbriche IA, tra cui le piattaforme NVIDIA Vera Rubin NVL72 e HGX™ Vera Rubin NVL8. Vera alimenta le GPU per l'IA su larga scala durante l'esecuzione del lavoro della CPU che mantiene la fabbrica operativa, tra cui ETL, la gestione della cache key-value (KV) e l'orchestrazione. Con prestazioni elevate su singolo thread, un'enorme larghezza di banda di memoria e un design a die di calcolo singolo che evita la latenza tra chiplet, Vera offre prestazioni prevedibili, mantenendo le GPU completamente utilizzate in sistemi IA e HPC accelerati.

CPU standalone

Per l'IA agentica, l'apprendimento per rinforzo, l'elaborazione dei dati e l'analisi, NVIDIA Vera offre prestazioni per core leader e un'enorme larghezza di banda di memoria per eseguire migliaia di ambienti sandbox paralleli, chiamate di strumenti, esecuzioni di codice, loop di valutazione e flussi di lavoro di dati. Un'esecuzione della CPU più rapida significa che gli agenti aspettano meno, i sistemi RL generano più feedback per passaggio di addestramento e le fabbriche IA producono più token per dollaro. Essendo una piattaforma CPU autonoma, Vera supporta anche i carichi di lavoro cloud iperscalabili, aziendali e HPC e si estende all'infrastruttura di storage con NVIDIA Vera BlueField®-4 STX. Disponibile come rack CPU NVIDIA Vera denso e raffreddato a liquido o in configurazioni standard a doppio e singolo socket, Vera si adatta a qualsiasi data center.

Funzionalità

Esplora le innovazioni tecnologiche

Progettata per le esigenze dell'apprendimento per rinforzo e dell'IA agentica, NVIDIA Vera combina core Olympus progettati su misura, memoria LPDDR5X ad alta larghezza di banda e NVIDIA Scalable Coherency Fabric (SCF) a bassa latenza. Con la connettività NVIDIA NVLink™-C2C, il Confidential Computing e la piena compatibilità con Arm®, Vera si estende ai sistemi accelerati e ai moderni ambienti di data center. La sua architettura di calcolo monolitica mantiene gli ambienti software reattivi e i dati in movimento in modo efficiente, contribuendo a massimizzare il throughput, l'efficienza energetica e l'utilizzo delle GPU nei carichi di lavoro IA, analisi e HPC.

Core NVIDIA Custom Olympus

NVIDIA Vera è dotata di 88 core Olympus personalizzati progettati per il lavoro ad alto controllo e sensibile alla latenza dietro l'IA agentica e l'apprendimento per rinforzo. Le elevate prestazioni a singolo thread aiutano gli ambienti software, le chiamate di strumenti e i loop di valutazione a completarsi più rapidamente, mentre NVIDIA Spatial Multithreading crea 176 thread con risorse core partizionate per un throughput prevedibile su larga scala.

Sottosistema di memoria LPDDR5X

NVIDIA Vera offre fino a 1,2 terabyte al secondo (TB/s) di larghezza di banda di memoria LPDDR5X, fornendo 2 volte la larghezza di banda a metà della potenza della memoria delle CPU tradizionali. Ciò mantiene migliaia di ambienti software paralleli reattivi, supportando iterazioni RL più veloci, una gestione efficiente della cache KV e flussi di lavoro agentici ad alta intensità di dati. Con fino a 1,5 TB di memoria, Vera fornisce la capacità e l'efficienza per le fabbriche IA, l'analisi e i carichi di lavoro HPC.

NVIDIA SCF di seconda generazione

NVIDIA Vera utilizza NVIDIA SCF di seconda generazione per connettere tutti gli 88 core, la cache, la memoria, l'input e l'output (IO) e NVLink-C2C su un singolo chip di calcolo. Con 3,4 TB/s di larghezza di banda bisezionale e un'architettura di cache unificata, SCF offre ai core un accesso rapido e costante ai dati anche quando la CPU è completamente utilizzata. Evitando la comunicazione cross-chiplet, Vera mantiene una latenza e un throughput prevedibili per i carichi di lavoro agentici, l'analisi e l'infrastruttura di fabbrica IA su larga scala.

NVIDIA NVLink-C2C

NVIDIA NVLink-C2C offre fino a 1,8 TB/s di larghezza di banda coerente tra le CPU Vera e le GPU NVIDIA. In combinazione con le GPU NVIDIA Rubin, Vera crea un'architettura di memoria unificata che aiuta CPU e GPU a lavorare insieme su carichi di lavoro IA e HPC complessi, set di dati di grandi dimensioni e offload della cache KV. NVLink-C2C riduce i colli di bottiglia del trasferimento dei dati, semplifica l'ottimizzazione, supporta l'isolamento sicuro per i dati e il codice sensibili e consente la connettività ad alta velocità nei sistemi CPU Vera a doppio socket.

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica le tecnologie all'avanguardia di NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX®-9 e DPU BlueField-4. Aumenta l'intelligenza in una piattaforma scalabile in rack con lo switch NVLink 6 e si espande con NVIDIA Quantum-X800 InfiniBand e Spectrum-X™ Ethernet per alimentare la rivoluzione industriale dell'IA.