Microsoft が LLM 推論エネルギーの測定 (本番規模) を発表 • コストの中央値: 0.34 Wh/クエリ (チャットボット) • 長い推論: 4.3 Wh/クエリ (~13× 以上) • フリート規模: ~0.9 GWh/日 @1B クエリ→ ~Web 検索レベル •公衆推定多くの場合4〜20×高すぎる - 効率向上(モデル、サービング、ハードウェア)→8〜20×低エネルギー化 長い出力がエネルギーを支配します。スマートな最適化により、AI フットプリントを管理しやすく保ちます。