Microsoft przedstawia pomiar energii wnioskowania LLM (w skali produkcji) • Średni koszt: 0,34 Wh/zapytanie (czatbot) • Długie rozumowanie: 4,3 Wh/zapytanie (~13× wyższe) • Skala floty: ~0,9 GWh/dzień przy 1B zapytaniach → ~poziom wyszukiwania w sieci • Publiczne szacunki często 4–20× zbyt wysokie • Zyski efektywności (model, serwowanie, sprzęt) → możliwe 8–20× niższe zużycie energii Długie wyjścia dominują zużycie energii; inteligentna optymalizacja utrzymuje ślad AI w rozsądnych granicach.