Le pitch long de $NVDA est le suivant : Vous avez un espace limité pour un rack - cela est limité par les murs d'un DC, mais surtout par la quantité d'énergie disponible. Sur cette empreinte, vous pouvez placer vos propres puces, NVDA, potentiellement des ASIC, mais l'objectif final est de servir des tokens que vous pouvez vendre + un spread. Dans ce TCO, il y a le coût du rack + l'énergie (qui, lors de la comparaison entre les racks, est fixe). Donc la question est de savoir combien vous payez pour le rack et combien de tokens il peut générer au cours de sa durée de vie utile. NVL72 peut produire 1,5 million de tokens/s, à 0,40 $ / million de tokens en sortie. Même si cela se comprime de 70 % chaque année, ce rack générera presque 26 millions de dollars de revenus en 3 ans - 4 millions de dollars pour le rack, soit 22 millions de dollars. Ce que Jensen dit, c'est que si vous donnez les racks, les boîtes ne sont pas suffisamment performantes pour générer 22 millions de dollars de revenus d'inférence. SI vous aviez un espace illimité, vous pourriez peut-être compenser la moins bonne performance en en mettant plus ensemble (ce que fait la Chine), et finir avec plus de revenus. En supposant 1) que chaque rack est utilisé par la demande de tokens 2) que nous sommes contraints par l'énergie 3) que le prix ne peut pas descendre à un niveau qui compense la moins bonne performance - NVDA est un long.