NVIDIA NVLink Fusion

Infraestrutura de IA semipersonalizada com desempenho de ampliação de IA comprovado pelo setor e arquitetura em escala de rack.

Visão Geral

Fábricas de IA Semipersonalizadas com NVLink Fusion

O NVIDIA NVLink™ Fusion é a tecnologia e a IP conectiva de alta largura de banda e baixa latência que permite que os hiperescaladores e nativos de IA implantem XPUs e CPUs personalizadas na plataforma de infraestrutura de excelência da IA da NVIDIA. Aproveite o stack e o ecossistema de tecnologia comprovados de scale-up e scale-out da NVIDIA, bem como a arquitetura em escala de rack MGX™, para reduzir a complexidade do desenvolvimento, aumentar o desempenho e acelerar o tempo de lançamento no mercado para fábricas de IA semipersonalizadas. Com padronização em uma única arquitetura unificada, o NVLink Fusion simplifica as operações em todo o Data Center, permite o reprovisionamento flexível da capacidade do Data Center e permite que XPUs personalizadas se integrem perfeitamente a GPUs para computação heterogênea. 

AWS integra a infraestrutura de IA com o NVIDIA NVLink Fusion para a implantação do Trainium4

Saiba como a AWS está usando o NVLink Fusion para acelerar a implantação do Trainium4.

Integração da Computação Semipersonalizada na Arquitetura em Escala de Rack com o NVIDIA NVLink Fusion.

Saiba como o NVIDIA NVLink Fusion permite que os hiperescaladores criem infraestrutura de IA semipersonalizada, integrando seus ASICs ou CPUs com as GPUs NVIDIA, padronizando em uma única infraestrutura de hardware escalável.

Com o NVLink Fusion, as fábricas de IA de alto desempenho podem escalar rapidamente, beneficiando-se de todos os componentes da solução que compõem a arquitetura em escala de rack da NVIDIA.

Benefícios

Benefícios do NVLink Fusion

Desempenho de Classe Mundial em Escalabilidade

Desbloquear todo o potencial das fábricas de IA requer uma comunicação rápida e perfeita entre todos os aceleradores. O NVIDIA NVLink 6 pode conectar 72 XPUs de forma completa a uma taxa de 3,6 TB/s por XPU, com configurações futuras de roadmap incluindo tamanhos de domínio de até 1.152, para aumentar o desempenho de IA e o retorno sobre o investimento.

Ecossistema de tecnologia e cadeia de suprimentos testados e aprovados em produção

O ecossistema abrangente de tecnologia NVLink Fusion, incluindo parceiros de design de XPU, parceiros de CPU e fornecedores de IP, ajuda hiperescaladores e nativos de IA a otimizar os designs de XPU e simplificar o desenvolvimento. O ecossistema MGX fornece uma arquitetura abrangente em escala de rack e conecta os hiperescaladores dos adotantes à mesma cadeia de suprimentos comprovada que a NVIDIA usa para seus próprios sistemas baseados em MGX, eliminando a complexidade de novos designs de rack e gerenciamento de fornecedores e acelerando o tempo de lançamento no mercado. 

Reprovisionamento flexível e mitigação de riscos de implantação

Um dos principais benefícios da adoção da arquitetura de rack MGX é que os sistemas baseados em XPU e GPU (como o Vera Rubin NVL72) podem ser facilmente projetados no mesmo Data Center, compartilhando os mesmos racks e ocupação de rack, rede, resfriamento, fornecimento de energia e sistemas de gerenciamento. Essa abordagem unificada permite que os adotantes do NVLink Fusion dissociem o design e a construção de Data Center da prontidão e do suprimento de silício, e permite que eles reprovisionem facilmente a capacidade do Data Center com uma combinação diferente de sistemas baseados em XPU ou GPU, à medida que as necessidades evoluem.

Arquitetura unificada para infraestrutura de IA heterogênea

Usuários do NVLink Fusion podem implantar diferentes tipos de XPUs — ou XPUs e GPUs — no mesmo Data Center para computação heterogênea, para inferência desagregada e outras workloads assimétricas.

O resultado é uma única fábrica de IA semipersonalizada que nenhuma empresa poderia criar sozinha.

Plataforma

Tecnologia NVIDIA NVLink Fusion

NVIDIA NVLink

O NVIDIA NVLink 6 e o Chip de Switch NVLink permitem 260 TB/s de largura de banda em um único domínio NVLink de 72 aceleradores (NVL72) e oferecem eficiência 4 vezes maior de largura de banda com o suporte ao NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8.

NVIDIA NVLink-C2C

O NVIDIA NVLink-C2C estende a tecnologia NVLink líder do setor para uma interconexão de chip a chip. Isso permite a criação de uma nova classe de produtos integrados com parceiros da NVIDIA, criados por meio de chiplets, permitindo que as GPUs ou CPUs da NVIDIA tenham uma conexão coerente de alta largura de banda com silício personalizado.

Plataforma de infraestrutura de IA

A NVIDIA fornece um portfólio modular de tecnologia de fábrica de IA, incluindo GPUs NVIDIA, CPUs NVIDIA Vera, switches de óptica co-empacotados (CPO), ConnectX® SuperNICs™, DPUs BlueField® e software de Mission Control™ para otimizar workflows de IA e gerenciar infraestrutura de IA.

As soluções de rack completas também estão disponíveis para integração de fábricas de IA semipersonalizadas, incluindo o rack Vera Rubin NVL72, que pode ser combinado com sistemas baseados em XPU para inferência desagregada, o rack Vera CPU para oferecer suporte a sistemas de IA baseada em agentes e aprendizagem por reforço, o rack NVIDIA LPX para ajudar na inferência de alto contexto e baixa latência, o rack NVIDIA STX para armazenamento nativo de IA e o rack NVIDIA SPX para redes em scale-out.

Adotantes

Ecossistema NVLink Fusion

Escalando o desempenho de inferência de IA com o NVLink Fusion

Saiba como o NVIDIA NVLink Fusion aborda as crescentes demandas de modelos de IA complexos.