El $NVDA largo es este: Tiene un espacio finito para un rack, esto está limitado por las paredes de un DC, pero principalmente por la cantidad de energía disponible. En esa huella, puede colocar sus propios chips, NVDA, potencialmente ASIC, pero el objetivo final es servir tokens que pueda vender + un diferencial. En ese TCO está el coste del rack + potencia (que al comparar entre racks, es fijo). Entonces, la pregunta es cuánto está pagando por el estante y cuántas fichas puede escupir durante su vida útil. NVL72 puede hacer 1.5m token/s, @ 0.40c /millón en tokens de salida. Incluso si eso se comprime en un 70% cada año, ese rack generará casi $ 26 millones en ingresos en 3 años - $ 4 millones para el rack, = $ 22 millones Lo que Jensen está diciendo es que si regalas los racks, las cajas no tienen el rendimiento suficiente para generar $ 22 millones en revoluciones de inferencia. Si tuviera una huella ilimitada, tal vez podría compensar el peor rendimiento, juntando más (que es lo que está haciendo China), y terminar con más ingresos. Suponiendo 1) que cada rack está agotado por la demanda de tokens 2) estamos limitados por la energía 3) el precio no puede flexionarse hacia abajo a un nivel que compense el peor rendimiento, NVDA es largo.