這篇新論文真是太瘋狂了! 它建議基於 LLM 的代理運作遵循宏觀物理法則,類似於粒子在熱力學系統中的行為。 而且看起來這是一個適用於各種模型的發現。 LLM 代理在不同領域的表現非常好,但我們並沒有理論來解釋為什麼。 這些系統的行為通常被視為複雜內部工程的直接產物:提示模板、記憶模塊和複雜的工具調用。其動態仍然是一個黑箱。 這項新研究表明,LLM 驅動的代理顯示出詳細平衡,這是物理學中平衡系統的一個基本特性。 這意味著什麼? 這表明 LLM 不僅僅是學習規則集和策略;它們可能在隱式學習一個潛在函數,該函數全局評估狀態,捕捉類似於「LLM 認為某個狀態距離目標有多遠」的東西。這使得有方向的收斂成為可能,而不會陷入重複的循環中。 研究人員將 LLM 嵌入代理框架中,並測量狀態之間的轉移概率。利用物理學中的最小作用原則,他們估計了支配這些轉移的潛在函數。 在 GPT-5 Nano、Claude-4 和 Gemini-2.5-flash 的結果中:狀態轉移在很大程度上滿足詳細平衡條件。這表明它們的生成動態展現出類似於平衡系統的特徵。 在一個符號擬合任務中,涉及 50,228 次狀態轉移,跨越 7,484 個不同的狀態,69.56% 的高概率轉移朝向較低的潛力移動。潛在函數捕捉了表達層級的特徵,如複雜性和語法有效性,而不需要字符串層級的信息。 不同模型在探索-利用光譜上顯示出不同的行為。Claude-4 和 Gemini-2.5-flash 快速收斂到幾個狀態。GPT-5 Nano 廣泛探索,在 20,000 次生成中產生了 645 個不同的有效輸出。 這可能是 LLM 生成動態中第一個不依賴於特定模型細節的宏觀物理法則的發現。這表明我們可以將 AI 代理視為具有可測量、可預測特性的物理系統,而不僅僅是工程工件。 論文: 在我們的學院學習如何構建有效的 AI 代理: