Microsoft представляет Измерение энергии вывода LLM (в производственном масштабе) • Средняя стоимость: 0.34 Втч/запрос (чат-бот) • Долгое рассуждение: 4.3 Втч/запрос (~13× выше) • Масштаб флота: ~0.9 ГВтч/день при 1 млрд запросов → ~уровень веб-поиска • Оценки общественности часто на 4–20× завышены • Повышение эффективности (модель, обслуживание, оборудование) → возможно снижение потребления энергии на 8–20× Долгие выводы доминируют по потреблению энергии; умная оптимизация позволяет поддерживать управляемый след ИИ.