这篇新论文真是太疯狂了! 它建议基于LLM的代理按照宏观物理法则运作,类似于粒子在热力学系统中的行为。 看起来这是一个适用于各种模型的发现。 LLM代理在不同领域表现得非常好,但我们没有理论来解释为什么。 这些系统的行为通常被视为复杂内部工程的直接产物:提示模板、记忆模块和复杂的工具调用。其动态仍然是一个黑箱。 这项新研究表明,LLM驱动的代理表现出详细平衡,这是物理学中平衡系统的基本特性。 这意味着什么? 这表明LLM不仅仅学习规则集和策略;它们可能在隐式学习一个潜在函数,该函数全局评估状态,捕捉类似于“LLM感知一个状态距离目标有多远”的东西。这使得有针对性的收敛成为可能,而不会陷入重复的循环中。 研究人员将LLM嵌入代理框架中,并测量状态之间的转移概率。利用物理学中的最小作用原理,他们估计了支配这些转移的潜在函数。 在GPT-5 Nano、Claude-4和Gemini-2.5-flash的结果中:状态转移在很大程度上满足详细平衡条件。这表明它们的生成动态表现出类似于平衡系统的特征。 在一个符号拟合任务中,涉及50,228个状态转移,跨越7,484个不同状态,69.56%的高概率转移朝向较低的潜力移动。潜在函数捕捉了复杂性和句法有效性等表达级特征,而无需字符串级信息。 不同模型在探索-开发谱上表现出不同的行为。Claude-4和Gemini-2.5-flash迅速收敛到少数状态。GPT-5 Nano广泛探索,在20,000次生成中产生了645个不同的有效输出。 这可能是LLM生成动态中第一个不依赖于特定模型细节的宏观物理法则的发现。它表明我们可以将AI代理视为具有可测量、可预测属性的物理系统,而不仅仅是工程制品。 论文: 在我们的学院学习如何构建有效的AI代理: