Les modèles Mixture-of-Experts (MoE) comme DeepSeek-R1 débloquent de nouveaux niveaux de capacité—mais seulement s'ils peuvent évoluer efficacement. C'est là qu'intervient la co-conception extrême matériel-logiciel à l'échelle des racks. Avec NVIDIA Blackwell et NVIDIA Dynamo, les fournisseurs de services d'IA peuvent transformer des clusters en systèmes d'inférence intelligents—atteignant 10× de performance et de revenus tout en réduisant le coût par jeton.
Maintenant, avec l'intégration de NVIDIA Dynamo avec les principaux fournisseurs de cloud, cette même performance révolutionnaire est disponible pour les clients cloud—y compris @AWSCloud, @Azure, @GoogleCloud et @OracleCloud. En savoir plus :
185