O $NVDA passo longo é este: Você tem um espaço finito para um rack - isso é limitado pelas paredes de um DC, mas principalmente pela quantidade de energia disponível. Nessa pegada, você pode colocar seus próprios chips, NVDA, potencialmente ASICs, mas o objetivo final é servir tokens que você pode vender + um spread. Nesse TCO há o custo do rack + potência (que ao comparar entre racks, é fixo). Portanto, a questão é quanto você está pagando pelo rack e quantos tokens ele pode cuspir ao longo de sua vida útil. NVL72 pode fazer 1,5 milhão de tokens/s, @ 0,40c/milhão em tokens de saída. Mesmo que isso seja reduzido em 70% a cada ano, esse rack gerará quase US$ 26 milhões em receita em 3 anos - US$ 4 milhões para o rack, = US$ 22 milhões O que Jensen está dizendo é que, se você doar os racks, as caixas não terão desempenho suficiente para gerar US $ 22 milhões em rotações de inferência. SE você tivesse pegada ilimitada, talvez pudesse compensar o pior desempenho, juntando mais (que é o que a China está fazendo) e acabar com mais receitas. Supondo 1) que cada rack seja usado pela demanda simbólica 2) estamos com restrições de energia 3) o preço não pode ser flexionado a um nível que compense o pior desempenho - o NVDA é longo.