A proposta de longo prazo para a $NVDA é a seguinte: Você tem um espaço finito para um rack - isso é limitado pelas paredes de um DC, mas principalmente pela quantidade de energia disponível. Nesse espaço, você pode colocar seus próprios chips, NVDA, potencialmente ASICs, mas o objetivo final é servir tokens que você pode vender + um spread. Nesse TCO, há o custo do rack + energia (que ao comparar entre racks, é fixo). Então, a questão é apenas quanto você está pagando pelo rack e quantos tokens ele pode gerar ao longo de sua vida útil. O NVL72 pode fazer 1,5m token/s, a $0,40 /milhão em tokens de saída. Mesmo que isso se comprima em 70% a cada ano, esse rack gerará quase $26m em receita em 3 anos - $4m para o rack, = $22m. O que Jensen está dizendo é que se você der os racks, os boxes não são suficientemente performáticos para gerar $22m em receitas de inferência. SE você tivesse um espaço ilimitado, poderia talvez compensar o pior desempenho, juntando mais (que é o que a China está fazendo), e acabar com mais receitas. Assumindo 1) que cada rack é utilizado pela demanda de tokens 2) estamos limitados pela energia 3) o preço não pode ser ajustado para um nível que compense o pior desempenho - a NVDA é uma aposta de longo prazo.