Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Agenții LLM se descompun în sarcini lungi.
Aici contează cu adevărat ingineria contextului.
Agenții pot raționa și folosi unelte, dar operațiunile extinse cauzează o creștere nelimitată a contextului și erori acumulate.
Soluții comune precum compresia contextului sau forța de stimulare augmentată prin recuperare reprezintă compromisuri între fidelitatea informației și stabilitatea raționamentului.
Această nouă cercetare introduce InfiAgent, un cadru care menține contextul raționamental al agentului strict limitat, indiferent cât durează sarcina.
Ideea este externalizarea stării persistente într-o abstracție centrată pe fișier. În loc să înghesuie totul în context, agentul menține un spațiu de lucru cu fișiere care persistă pe pași. La fiecare punct de decizie, reconstruiește contextul dintr-o instantanee a stării spațiului de lucru plus o fereastră fixă de acțiuni recente.
Aceasta decuplează durata sarcinii de dimensiunea contextului. Indiferent dacă sarcina durează 10 sau 1000 de pași, contextul de raționament rămâne la fel.
Acest lucru este util pentru că abordarea nu necesită ajustări fine specifice unei sarcini. Agentul funcționează la fel, indiferent de domeniu.
Experimentele pe DeepResearch și o sarcină de revizuire a literaturii de 80 de articole arată că InfiAgent cu un model open-source de 20B este competitiv cu sistemele proprietare mai mari. Menține o acoperire mult mai mare pe orizontul lung decât liniile de bază centrate pe context.
Revizuirea literaturii de 80 de lucrări este deosebit de relevantă. Acesta este exact genul de sarcină extinsă în care agenții tradiționali acumulează erori și pierd firul a ceea ce au făcut. Externalizarea stării bazate pe fișiere a InfiAgent previne această degradare.
Hârtie:
Învață să construiești agenți AI eficienți în academia noastră:

Limită superioară
Clasament
Favorite
