トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
この新しい論文は本当にすごいです!
この研究は、LLMベースのエージェントが熱力学系における粒子の振る舞いに似た巨視的な物理法則に従って動作することを示唆しています。
そして、これはモデルを超えて当てはまる発見のようです。
LLMエージェントは異なる領域で非常によく機能しますが、その理由についての理論はまだありません。
これらのシステムの挙動は、複雑な内部エンジニアリングの直接的な産物と見なされることが多いです。プロンプトテンプレート、メモリモジュール、高度なツール呼び出しなどです。このダイナミクスは依然としてブラックボックスのままです。
この新しい研究は、LLM駆動のエージェントが詳細なバランスを示すことを示唆しており、これは物理学における平衡システムの基本的な性質です。
これはどういう意味でしょうか?
これは、LLMが単にルールセットや戦略を学ぶだけでなく、彼らは暗黙のうちに、状態を全体的に評価する潜在関数を学んでいるのかもしれません。例えば「LLMが状態を目標からどれだけ離れているかを捉えている」といったものを捉えているのです。これにより、繰り返しのサイクルに陥ることなく指向収束が可能になります。
研究者たちはLLMをエージェントフレームワークに組み込み、状態間の遷移確率を測定しました。物理学の最小作用原理を用いて、これらの遷移を支配するポテンシャル関数を推定しました。
GPT-5 Nano、Claude-4、Gemini-2.5-flash 全体の結果:状態遷移は詳細なバランス条件をほぼ満たしています。これは、彼らの生成ダイナミクスが平衡システムに似た特徴を示すことを示しています。
7,484の異なる状態にまたがる50,228の状態遷移を扱う象徴的なフィッティング課題では、高確率遷移の69.56%が低いポテンシャルへと移動しました。この潜在関数は、文字列レベルの情報を必要とせずに、複雑性や構文妥当性といった表現レベルの特徴を捉えていました。
異なるモデルは探査と利用のスペクトラム上で異なる挙動を示しました。クロード4型とジェミニ2.5型フラッシュは急速に数段階に収束しました。GPT-5 Nanoは広く探求し、2万世代で645種類の有効な出力を生み出しました。
これは、特定のモデルの詳細に依存しないLLM生成動力学におけるマクロな物理法則の初めての発見かもしれません。AIエージェントを単なる工学的アーティファクトではなく、測定可能で予測可能な特性を持つ物理システムとして研究できると示唆しています。
論文:
私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう:

トップ
ランキング
お気に入り
