Infraestrutura de IA semipersonalizada com desempenho de ampliação de IA comprovado pelo setor e arquitetura em escala de rack.
O NVIDIA NVLink™ Fusion é a tecnologia e a IP conectiva de alta largura de banda e baixa latência que permite que os hiperescaladores e nativos de IA implantem XPUs e CPUs personalizadas na plataforma de infraestrutura de excelência da IA da NVIDIA. Aproveite o stack e o ecossistema de tecnologia comprovados de scale-up e scale-out da NVIDIA, bem como a arquitetura em escala de rack MGX™, para reduzir a complexidade do desenvolvimento, aumentar o desempenho e acelerar o tempo de lançamento no mercado para fábricas de IA semipersonalizadas. Com padronização em uma única arquitetura unificada, o NVLink Fusion simplifica as operações em todo o Data Center, permite o reprovisionamento flexível da capacidade do Data Center e permite que XPUs personalizadas se integrem perfeitamente a GPUs para computação heterogênea.
Benefícios
Desbloquear todo o potencial das fábricas de IA requer uma comunicação rápida e perfeita entre todos os aceleradores. O NVIDIA NVLink 6 pode conectar 72 XPUs de forma completa a uma taxa de 3,6 TB/s por XPU, com configurações futuras de roadmap incluindo tamanhos de domínio de até 1.152, para aumentar o desempenho de IA e o retorno sobre o investimento.
O ecossistema abrangente de tecnologia NVLink Fusion, incluindo parceiros de design de XPU, parceiros de CPU e fornecedores de IP, ajuda hiperescaladores e nativos de IA a otimizar os designs de XPU e simplificar o desenvolvimento. O ecossistema MGX fornece uma arquitetura abrangente em escala de rack e conecta os hiperescaladores dos adotantes à mesma cadeia de suprimentos comprovada que a NVIDIA usa para seus próprios sistemas baseados em MGX, eliminando a complexidade de novos designs de rack e gerenciamento de fornecedores e acelerando o tempo de lançamento no mercado.
Um dos principais benefícios da adoção da arquitetura de rack MGX é que os sistemas baseados em XPU e GPU (como o Vera Rubin NVL72) podem ser facilmente projetados no mesmo Data Center, compartilhando os mesmos racks e ocupação de rack, rede, resfriamento, fornecimento de energia e sistemas de gerenciamento. Essa abordagem unificada permite que os adotantes do NVLink Fusion dissociem o design e a construção de Data Center da prontidão e do suprimento de silício, e permite que eles reprovisionem facilmente a capacidade do Data Center com uma combinação diferente de sistemas baseados em XPU ou GPU, à medida que as necessidades evoluem.
Usuários do NVLink Fusion podem implantar diferentes tipos de XPUs — ou XPUs e GPUs — no mesmo Data Center para computação heterogênea, para inferência desagregada e outras workloads assimétricas.
O resultado é uma única fábrica de IA semipersonalizada que nenhuma empresa poderia criar sozinha.
Plataforma
O NVIDIA NVLink 6 e o Chip de Switch NVLink permitem 260 TB/s de largura de banda em um único domínio NVLink de 72 aceleradores (NVL72) e oferecem eficiência 4 vezes maior de largura de banda com o suporte ao NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8.
O NVIDIA NVLink-C2C estende a tecnologia NVLink líder do setor para uma interconexão de chip a chip. Isso permite a criação de uma nova classe de produtos integrados com parceiros da NVIDIA, criados por meio de chiplets, permitindo que as GPUs ou CPUs da NVIDIA tenham uma conexão coerente de alta largura de banda com silício personalizado.
A NVIDIA fornece um portfólio modular de tecnologia de fábrica de IA, incluindo GPUs NVIDIA, CPUs NVIDIA Vera, switches de óptica co-empacotados (CPO), ConnectX® SuperNICs™, DPUs BlueField® e software de Mission Control™ para otimizar workflows de IA e gerenciar infraestrutura de IA.
As soluções de rack completas também estão disponíveis para integração de fábricas de IA semipersonalizadas, incluindo o rack Vera Rubin NVL72, que pode ser combinado com sistemas baseados em XPU para inferência desagregada, o rack Vera CPU para oferecer suporte a sistemas de IA baseada em agentes e aprendizagem por reforço, o rack NVIDIA LPX para ajudar na inferência de alto contexto e baixa latência, o rack NVIDIA STX para armazenamento nativo de IA e o rack NVIDIA SPX para redes em scale-out.
Adotantes
Saiba como o NVIDIA NVLink Fusion aborda as crescentes demandas de modelos de IA complexos.