تقدم Microsoft قياس طاقة استدلال LLM (مقياس الإنتاج) • التكلفة المتوسطة: 0.34 واط / استعلام (chatbot) • التفكير الطويل: 4.3 واط / استعلام (~ 13× أعلى) • مقياس الأسطول: ~ 0.9 جيجاوات ساعة / يوم @1B استعلامات → ~ مستوى بحث الويب • تقديرات عامة غالبا 4-20× مرتفعة جدا • مكاسب الكفاءة (النموذج ، الخدمة ، الأجهزة) → 8-20× طاقة أقل ممكنة المخرجات الطويلة تهيمن على الطاقة. يحافظ التحسين الذكي على إمكانية إدارة بصمة الذكاء الاصطناعي.