Uma entrevista muito perspicaz com um funcionário da $NVDA (também ex-funcionário da $GOOGL) sobre o tópico $NVDA/ASIC: 1. Ele não acha que a divisão entre $NVDA e ASICs nos próximos 5 anos será 50/50, mas mais como 80/20 ou 70/30 a favor de $NVDA. Ele acha que $GOOGL TPUs trazem economia de custos, mas não acha que eles tenham o mesmo desempenho que as GPUs $NVDA. Ele menciona que, em uma base de token por segundo, um TPU está em torno de 1500-2000 tokens por segundo, enquanto um H100 está em 2000-3500 tokens por segundo na configuração otimizada. 2. Ele dá exemplos de quando TPUs ou GPUs são bons para uso. Se você executasse a inferência ChatGPT5 para consultas simples, como desenho de imagens, ele acha que as TPUs seriam mais econômicas. Ele também menciona que eles estão vendo que a $GOOGL está oferecendo descontos significativos aos clientes para usar TPUs. 3. Ele menciona que, em sua opinião, o xAI de Elon está construindo uma tremenda força de vendas e causando uma grande disrupção, e que seu objetivo é vender computação e se tornar $ORCL. 4. Ele diz que $NVDA em alguns casos está colocando novas GPUs / aceleradores e recomprando as antigas dos clientes: »Se um cliente tiver A100s e quiser ir para H100s, compraremos de volta os servidores e os chips e depois os revenderemos no exterior.« 5. Ele sugere que acredita que $CRWV será um "monstro absoluto" nos próximos 3-5 anos, pois eles estão recebendo priorização de $NVDA. Ele também sugere alguns anúncios significativos no próximo GTC em outubro, especificamente no lado da manufatura dos EUA. Encontrado em @AlphaSenseInc