Ik ben optimistisch over de elasticiteit van de vraag naar inferentie, maar met inferentie die naar de rand (laptops, smartphones) verschuift, zou het meeste AI-werk dan niet lokaal moeten plaatsvinden? Er is een wereld waarin we de juiste volgorde van grootte voor de vraag raden, maar verkeerd dat het voornamelijk vanuit hyperscaler datacenters zal draaien.
4,54K