Os modelos de mistura de especialistas (MoE), como o DeepSeek-R1, desbloqueiam novos níveis de capacidade, mas apenas se puderem ser dimensionados com eficiência. É aí que entra o co-design extremo de hardware e software em escala de rack. Com o NVIDIA Blackwell e o NVIDIA Dynamo, os provedores de serviços de IA podem transformar clusters em sistemas de inferência inteligentes, alcançando 10× de desempenho e receita enquanto reduzem o custo por token.
Agora, com a integração do NVIDIA Dynamo com os principais provedores de nuvem, o mesmo desempenho inovador está disponível para clientes de nuvem, incluindo @AWSCloud, @Azure, @GoogleCloud e @OracleCloud. Saiba Mais:
210