Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Această nouă lucrare este nebunească!
Sugerează că agenții bazați pe LLM funcționează conform legilor fizice macroscopice, similar cu modul în care particulele se comportă în sistemele termodinamice.
Și pare că este o descoperire care se aplică tuturor modelelor.
Agenții LLM funcționează foarte bine în domenii diferite, dar nu avem o teorie clară pentru motiv.
Comportamentul acestor sisteme este adesea privit ca un produs direct al ingineriei interne complexe: șabloane de prompt, module de memorie și apeluri sofisticate ale uneltelor. Dinamica rămâne o cutie neagră.
Această nouă cercetare sugerează că agenții conduși de LLM prezintă un echilibru detaliat, o proprietate fundamentală a sistemelor de echilibru în fizică.
Ce înseamnă asta?
Sugerează că LLM-urile nu învață doar seturi de reguli și strategii; ele pot învăța implicit o funcție potențială de bază care evaluează stările la nivel global, surprinzând ceva de genul "cât de departe percepe LLM-ul o stare de la obiectiv." Acest lucru permite convergența direcționată fără a rămâne blocat în cicluri repetitive.
Cercetătorii au integrat LLM-uri în cadrul agenților și au măsurat probabilitățile de tranziție între stări. Folosind un principiu de acțiune minimă din fizică, au estimat funcția potențială care guvernează aceste tranziții.
Rezultatele din GPT-5 Nano, Claude-4 și Gemini-2.5-flash: tranzițiile de stare satisfac în mare parte condiția detaliată de echilibru. Acest lucru indică faptul că dinamica lor generativă prezintă caracteristici similare cu sistemele de echilibru.
Într-o sarcină de potrivire simbolică, cu 50.228 de tranziții de stare în 7.484 de stări diferite, 69,56% dintre tranzițiile cu probabilitate mare s-au deplasat către potențial mai mic. Funcția potențială a captat caracteristici la nivel de expresie, precum complexitatea și validitatea sintactică, fără a avea nevoie de informații la nivel de șir.
Modele diferite au prezentat comportamente diferite pe spectrul explorării-exploatare. Claude-4 și Gemini-2.5-flash au convergit rapid către câteva stări. GPT-5 Nano a explorat pe scară largă, producând 645 de ieșiri valabile diferite în 20.000 de generații.
Aceasta ar putea fi prima descoperire a unei legi fizice macroscopice în dinamica generativă LLM care să nu depindă de detalii specifice ale modelului. Sugerează că putem studia agenții AI ca sisteme fizice cu proprietăți măsurabile și previzibile, mai degrabă decât doar artefacte de inginerie.
Hârtie:
Învață să construiești agenți AI eficienți în academia noastră:

Limită superioară
Clasament
Favorite
