هذه الورقة الجديدة مذهلة! يقترح أن العوامل القائمة على النماذج الكبيرة تعمل وفقا لقوانين فيزيائية ماكروسكوبية، مشابهة لكيفية تصرف الجسيمات في الأنظمة الديناميكية الحرارية. ويبدو أنه اكتشاف ينطبق على جميع النماذج. وكلاء النماذج الكبيرة تعمل بشكل جيد جدا في مجالات مختلفة، لكن ليس لدينا نظرية حول السبب. غالبا ما ينظر إلى سلوك هذه الأنظمة على أنه نتاج مباشر للهندسة الداخلية المعقدة: قوالب التوجيه، وحدات الذاكرة، واستدعاء الأدوات المتطور. الديناميكيات تبقى كصندوق أسود. تشير هذه الأبحاث الجديدة إلى أن العوامل المدفوعة بالنماذج الكبيرة الكبيرة تظهر توازنا مفصلا، وهو خاصية أساسية لأنظمة التوازن في الفيزياء. ماذا يعني هذا؟ يشير إلى أن نماذج اللغة الكبيرة لا تتعلم فقط مجموعات القواعد والاستراتيجيات؛ قد يتعلمون ضمنيا دالة محتملة أساسية تقيم الحالات عالميا، تلتقط شيئا مثل "مدى بعد النموذج الكبير للحالة عن الهدف." هذا يتيح التقارب الموجه دون الوقوع في دورات متكررة. قام الباحثون بدمج نماذج اللغة الكبيرة ضمن أطر الوكلاء وقياس احتمالات الانتقال بين الحالات. باستخدام مبدأ أقل فعل من الفيزياء، قدروا دالة الجهد التي تحكم هذه الانتقالات. النتائج عبر انتقالات الحالة في GPT-5 Nano، Claude-4، وGemini-2.5-flash: تلبي إلى حد كبير شرط التوازن التفصيلي. وهذا يشير إلى أن ديناميكياتها التوليدية تظهر خصائص مشابهة لأنظمة التوازن. في مهمة ملاءمة رمزية مع 50,228 انتقالا للحالات عبر 7,484 حالة مختلفة، تحركت 69.56٪ من الانتقالات ذات الاحتمالية العالية نحو جهد أقل. كانت الدالة المحتملة تلتقط ميزات على مستوى التعبير مثل التعقيد والصلاحية النحوية دون الحاجة إلى معلومات على مستوى النص. أظهرت نماذج مختلفة سلوكيات مختلفة على طيف الاستكشاف والاستغلال. تقارب كلود-4 وجيميني-2.5-فلاش بسرعة إلى عدة حالات. استكشف GPT-5 Nano على نطاق واسع، حيث أنتج 645 مخرجا صالحا مختلفا على مدار 20,000 جيل. قد يكون هذا أول اكتشاف لقانون فيزيائي ماكروسكوب في ديناميكيات التوليد في نماذج اللغة الكبيرة لا يعتمد على تفاصيل النموذج المحددة. يقترح أنه يمكننا دراسة وكلاء الذكاء الاصطناعي كأنظمة فيزيائية ذات خصائص قابلة للقياس والتنبؤ بدلا من مجرد قطع هندسية. الورقة: تعلم كيفية بناء وكلاء الذكاء الاصطناعي الفعالين في أكاديميتنا: