NVIDIA Vera Rubin 플랫폼

NVIDIA Vera Rubin 플랫폼

차세대 AI의 시대를 열다

개요

에이전틱 AI 시대를 선도하다

NVIDIA Vera Rubin 플랫폼은 에이전틱 AI 및 고도의 추론 시대를 위해 구축되었으며, 다단계 문제 해결과 대규모 롱 컨텍스트 워크플로우를 완벽하게 처리할 수 있도록 설계되었습니다. Vera Rubin은 5개의 특별히 설계된 랙 스케일 시스템을 하나의 대규모 코히어런트 AI 슈퍼컴퓨터로 통합하는 멀티랙 POD 규모 시스템입니다. 통신 및 메모리 이동에서 중요한 병목 현상을 제거함으로써 이 플랫폼은 추론을 강화하여 와트당 더 많은 토큰을 제공하고 토큰당 비용을 절감합니다.

전 세계 에이전틱 AI 팩토리 구동을 위한 NVIDIA Vera Rubin 양산 돌입

NVIDIA Vera Rubin은 본격적인 양산 단계에 돌입했습니다. 대만의 주요 서버 제조업체와 글로벌 공급망 파트너들은 Vera Rubin 기반 시스템을 대규모로 생산 및 출하하고 있으며, AI 연구소와 클라우드 서비스 제공업체, 하이퍼스케일러가 미래 AI를 구축할 수 있도록 지원하고 있습니다.

NVIDIA Vera Rubin, 차세대 AI 프론티어 개척

NVIDIA Vera Rubin 플랫폼은 세계 최대 규모의 AI 팩토리를 확장하기 위해 현재 7개의 새로운 칩을 본격 생산 중이며, AI의 차세대 최첨단 기술을 개척하고 있습니다.

Vera Rubin 플랫폼 내부 살펴보기

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72는 72개의 Rubin GPU, 36개의 Vera CPU, ConnectX™-9 SuperNIC™ 및 BlueField™-4 DPU와 같은 NVIDIA의 최첨단 기술을 통합합니다. NVIDIA NVLink™ 6 스위치를 기반으로 한 3세대 랙 스케일 플랫폼에서 AI 성능을 확장하고, NVIDIA Quantum-X800 InfiniBand 및 Spectrum-X™ Ethernet을 통해 확장성을 높여 대규모 AI 산업 혁신을 지원합니다.

Vera Rubin NVL72는 NVFP4 추론 성능을 높이기 위한 적응형 압축을 갖춘 새로운 트랜스포머 엔진, 전체 랙 스케일 플랫폼 전반에 걸쳐 보안을 확장하는 3세대 NVIDIA 컨피덴셜 컴퓨팅, ���리고 랙 스케일 탄력성을 제공하는 2세대 RAS 엔진을 특징으로 합니다.

NVIDIA Vera CPU

NVIDIA Vera CPU 랙은 강화 학습 및 대규모 에이전틱 AI를 위해 특별히 설계된 고밀도 수냉각 CPU 인프라를 제공합니다. NVIDIA MGX™ 모듈형 레퍼런스 아키텍처를 기반으로 구축된 각 랙은 256개의 NVIDIA Vera CPU를 통합하고 22,500개 이상의 동시 샌드박스 환경을 지원하며, AI 팩토리에 도구 호출, 평가, 데이터 처리 및 오케스트레이션을 위한 확장 가능하고 에너지 효율적인 CPU 용량을 제공합니다.

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX는 NVIDIA Vera Rubin을 위한 추론 가속기로, 에이전틱 시스템의 저지연 및 대규모 컨텍스트 요구 사항을 충족하도록 설계되었습니다. 고대역폭 메모리(HBM)를 위한 Rubin GPU와 정적 랜덤 액세스 메모리(SRAM)를 위한 LPU를 결합함으로써, LPX와 함께 NVIDIA Vera Rubin은 1조 매개변수 모델과 100만 개의 토큰을 가진 컨텍스트를 위한 새로운 수준의 추론 성능을 제공합니다.

NVIDIA Vera BlueField-4 STX

NVIDIA Vera BlueField-4 STX는 랙 스케일 AI 네이티브 스토리지 솔루션을 위한 모듈형 기반입니다. NVIDIA Vera Rubin, BlueField-4 STX 스토리지 프로세서, Spectrum-X 네트워킹, NVIDIA AI 소프트웨어를 통합함으로써 데이터 분석부터 모델 학습 및 대규모 전체 에이전틱 AI 워크플로우에 이르기까지 전체 데이터 라이프사이클을 최적화합니다.

NVIDIA Spectrum-6 SPX 이더넷

Spectrum-6 SPX 이더넷은 AI 팩토리 전반에서 네트워킹을 가속화하도록 설계되었습니다. NVIDIA Spectrum-X™ 이더넷 또는 NVIDIA Quantum-X800 InfiniBand 스위치로 구성할 수 있으며, 대규모 환경에서 저지연 시간과 고처리량의 랙-투-랙 연결을 제공합니다.

NVIDIA Vera Rubin 제품 살펴보기

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX™ Vera Rubin NVL72는 기업에 NVIDIA Vera Rubin 플랫폼을 기반으로 구축된 턴키의 즉시 배포 가능한 AI 인프라 솔루션을 제공합니다. 가장 복잡한 AI 모델을 가속화하기 위한 대규모 배포용으로 특별히 설계되었습니다.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8은 8개의 NVIDIA Rubin GPU와 6세대 NVLink로 구동되는 수냉식 AI 시스템입니다. 모든 AI 워크로드에 대한 학습, 추론 및 사후 학습을 가속화하기 위해 특별히 설계되었습니다.

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8은 8개의 NVIDIA Rubin GPU와 6세대 고속 NVLink 인터커넥트를 통합하여 데이터 센터를 가속 컴퓨팅 및 생성형 AI의 새로운 시대로 이끌어 나갑니다. NVIDIA HGX Rubin NVL8은 NVIDIA Vera CPU 또는 x86 기반 CPU 베이스보드와 함께 사용할 수 있습니다.

NVIDIA Vera Rubin NVL4

NVIDIA Vera Rubin NVL4는 NVLink-C2C를 통해 4개의 NVIDIA Rubin GPU를 2개의 NVIDIA Vera CPU에 연결하는 브리지를 통해 자동화된 과학적 발견과 에이전틱 AI를 실현합니다. 수냉식 NVIDIA MGX 서버와 호환되며, Hopper 대비 과학 시뮬레이션에서 최대 4배, AI-for-Science 학습에서 최대 6배, 추론에서 최대 8배 성능을 제공합니다.

NVIDIA Vera Rubin 플랫폼 살펴보기

본 기술 심층 분석 보고서를 통해 NVIDIA Vera Rubin이 칩 단위가 아닌 데이터 센터 전체를 하나의 컴퓨팅 단위로 다루는 방식을 확인해 보시기 바랍니다. 이를 통해 대규모 지능형 서비스를 효율적이고 안전하며 예측 가능한 방식으로 구현하는 새로운 토대를 마련할 수 있습니다.