차세대 AI의 시대를 열다
개요
NVIDIA Vera Rubin 플랫폼은 에이전틱 AI 및 고도의 추론 시대를 위해 구축되었으며, 다단계 문제 해결과 대규모 롱 컨텍스트 워크플로우를 완벽하게 처리할 수 있도록 설계되었습니다. Vera Rubin은 5개의 특별히 설계된 랙 스케일 시스템을 하나의 대규모 코히어런트 AI 슈퍼컴퓨터로 통합하는 멀티랙 POD 규모 시스템입니다. 통신 및 메모리 이동에서 중요한 병목 현상을 제거함으로써 이 플랫폼은 추론을 강화하여 와트당 더 많은 토큰을 제공하고 토큰당 비용을 절감합니다.
NVIDIA Vera Rubin NVL72는 72개의 Rubin GPU, 36개의 Vera CPU, ConnectX™-9 SuperNIC™ 및 BlueField™-4 DPU와 같은 NVIDIA의 최첨단 기술을 통합합니다. NVIDIA NVLink™ 6 스위치를 기반으로 한 3세대 랙 스케일 플랫폼에서 AI 성능을 확장하고, NVIDIA Quantum-X800 InfiniBand 및 Spectrum-X™ Ethernet을 통해 확장성을 높여 대규모 AI 산업 혁신을 지원합니다.
Vera Rubin NVL72는 NVFP4 추론 성능을 높이기 위한 적응형 압축을 갖춘 새로운 트랜스포머 엔진, 전체 랙 스케일 플랫폼 전반에 걸쳐 보안을 확장하는 3세대 NVIDIA 컨피덴셜 컴퓨팅, ���리고 랙 스케일 탄력성을 제공하는 2세대 RAS 엔진을 특징으로 합니다.
NVIDIA Vera CPU 랙은 강화 학습 및 대규모 에이전틱 AI를 위해 특별히 설계된 고밀도 수냉각 CPU 인프라를 제공합니다. NVIDIA MGX™ 모듈형 레퍼런스 아키텍처를 기반으로 구축된 각 랙은 256개의 NVIDIA Vera CPU를 통합하고 22,500개 이상의 동시 샌드박스 환경을 지원하며, AI 팩토리에 도구 호출, 평가, 데이터 처리 및 오케스트레이션을 위한 확장 가능하고 에너지 효율적인 CPU 용량을 제공합니다.
NVIDIA Groq 3 LPX는 NVIDIA Vera Rubin을 위한 추론 가속기로, 에이전틱 시스템의 저지연 및 대규모 컨텍스트 요구 사항을 충족하도록 설계되었습니다. 고대역폭 메모리(HBM)를 위한 Rubin GPU와 정적 랜덤 액세스 메모리(SRAM)를 위한 LPU를 결합함으로써, LPX와 함께 NVIDIA Vera Rubin은 1조 매개변수 모델과 100만 개의 토큰을 가진 컨텍스트를 위한 새로운 수준의 추론 성능을 제공합니다.
NVIDIA Vera BlueField-4 STX는 랙 스케일 AI 네이티브 스토리지 솔루션을 위한 모듈형 기반입니다. NVIDIA Vera Rubin, BlueField-4 STX 스토리지 프로세서, Spectrum-X 네트워킹, NVIDIA AI 소프트웨어를 통합함으로써 데이터 분석부터 모델 학습 및 대규모 전체 에이전틱 AI 워크플로우에 이르기까지 전체 데이터 라이프사이클을 최적화합니다.
Spectrum-6 SPX 이더넷은 AI 팩토리 전반에서 네트워킹을 가속화하도록 설계되었습니다. NVIDIA Spectrum-X™ 이더넷 또는 NVIDIA Quantum-X800 InfiniBand 스위치로 구성할 수 있으며, 대규모 환경에서 저지연 시간과 고처리량의 랙-투-랙 연결을 제공합니다.
본 기술 심층 분석 보고서를 통해 NVIDIA Vera Rubin이 칩 단위가 아닌 데이터 센터 전체를 하나의 컴퓨팅 단위로 다루는 방식을 확인해 보시기 바랍니다. 이를 통해 대규모 지능형 서비스를 효율적이고 안전하며 예측 가능한 방식으로 구현하는 새로운 토대를 마련할 수 있습니다.