Microsoft trình bày Đo lường năng lượng suy diễn LLM (quy mô sản xuất) • Chi phí trung bình: 0.34 Wh/truy vấn (chatbot) • Lý luận dài: 4.3 Wh/truy vấn (~13× cao hơn) • Quy mô đội tàu: ~0.9 GWh/ngày @1B truy vấn → ~mức tìm kiếm web • Ước tính công khai thường cao hơn 4–20× • Lợi ích hiệu suất (mô hình, phục vụ, phần cứng) → có thể giảm năng lượng 8–20× Đầu ra dài chiếm ưu thế về năng lượng; tối ưu hóa thông minh giữ cho dấu chân AI có thể quản lý.