一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

这篇新论文真是太疯狂了！它建议基于LLM的代理按照宏观物理法则运作，类似于粒子在热力学系统中的行为。看起来这是一个适用于各种模型的发现。 LLM代理在不同领域表现得非常好，但我们没有理论来解释为什么。这些系统的行为通常被视为复杂内部工程的直接产物：提示模板、记忆模块和复杂的工具调用。其动态仍然是一个黑箱。这项新研究表明，LLM驱动的代理表现出详细平衡，这是物理学中平衡系统的基本特性。这意味着什么？这表明LLM不仅仅学习规则集和策略；它们可能在隐式学习一个潜在函数，该函数全局评估状态，捕捉类似于“LLM感知一个状态距离目标有多远”的东西。这使得有针对性的收敛成为可能，而不会陷入重复的循环中。研究人员将LLM嵌入代理框架中，并测量状态之间的转移概率。利用物理学中的最小作用原理，他们估计了支配这些转移的潜在函数。在GPT-5 Nano、Claude-4和Gemini-2.5-flash的结果中：状态转移在很大程度上满足详细平衡条件。这表明它们的生成动态表现出类似于平衡系统的特征。在一个符号拟合任务中，涉及50,228个状态转移，跨越7,484个不同状态，69.56%的高概率转移朝向较低的潜力移动。潜在函数捕捉了复杂性和句法有效性等表达级特征，而无需字符串级信息。不同模型在探索-开发谱上表现出不同的行为。Claude-4和Gemini-2.5-flash迅速收敛到少数状态。GPT-5 Nano广泛探索，在20,000次生成中产生了645个不同的有效输出。这可能是LLM生成动态中第一个不依赖于特定模型细节的宏观物理法则的发现。它表明我们可以将AI代理视为具有可测量、可预测属性的物理系统，而不仅仅是工程制品。论文：在我们的学院学习如何构建有效的AI代理：