热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
这篇新论文真是太疯狂了!
它建议基于LLM的代理按照宏观物理法则运作,类似于粒子在热力学系统中的行为。
看起来这是一个适用于各种模型的发现。
LLM代理在不同领域表现得非常好,但我们没有理论来解释为什么。
这些系统的行为通常被视为复杂内部工程的直接产物:提示模板、记忆模块和复杂的工具调用。其动态仍然是一个黑箱。
这项新研究表明,LLM驱动的代理表现出详细平衡,这是物理学中平衡系统的基本特性。
这意味着什么?
这表明LLM不仅仅学习规则集和策略;它们可能在隐式学习一个潜在函数,该函数全局评估状态,捕捉类似于“LLM感知一个状态距离目标有多远”的东西。这使得有针对性的收敛成为可能,而不会陷入重复的循环中。
研究人员将LLM嵌入代理框架中,并测量状态之间的转移概率。利用物理学中的最小作用原理,他们估计了支配这些转移的潜在函数。
在GPT-5 Nano、Claude-4和Gemini-2.5-flash的结果中:状态转移在很大程度上满足详细平衡条件。这表明它们的生成动态表现出类似于平衡系统的特征。
在一个符号拟合任务中,涉及50,228个状态转移,跨越7,484个不同状态,69.56%的高概率转移朝向较低的潜力移动。潜在函数捕捉了复杂性和句法有效性等表达级特征,而无需字符串级信息。
不同模型在探索-开发谱上表现出不同的行为。Claude-4和Gemini-2.5-flash迅速收敛到少数状态。GPT-5 Nano广泛探索,在20,000次生成中产生了645个不同的有效输出。
这可能是LLM生成动态中第一个不依赖于特定模型细节的宏观物理法则的发现。它表明我们可以将AI代理视为具有可测量、可预测属性的物理系统,而不仅仅是工程制品。
论文:
在我们的学院学习如何构建有效的AI代理:

热门
排行
收藏
