Modelos de Mistura de Especialistas (MoE) como o DeepSeek-R1 desbloqueiam novos níveis de capacidade—mas apenas se puderem escalar de forma eficiente. É aí que o co-design extremo de hardware e software em escala de rack entra em cena. Com a NVIDIA Blackwell e a NVIDIA Dynamo, os provedores de serviços de IA podem transformar clusters em sistemas de inferência inteligentes—alcançando 10× de desempenho e receita enquanto reduzem o custo por token.
Agora, com a integração do NVIDIA Dynamo com os principais provedores de nuvem, esse mesmo desempenho inovador está disponível para os clientes da nuvem—incluindo @AWSCloud, @Azure, @GoogleCloud e @OracleCloud. Saiba mais:
212