Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ottimo documento sulla Memoria Agente.
Gli agenti LLM hanno bisogno sia di memoria a lungo termine che a breve termine per gestire compiti complessi.
Tuttavia, l'approccio predefinito di oggi tratta questi come componenti separati, ognuno con le proprie euristiche, controllori e strategie di ottimizzazione.
Ma la memoria non è due sistemi indipendenti. È un unico processo cognitivo che decide cosa memorizzare, recuperare, riassumere e dimenticare.
Questa nuova ricerca introduce AgeMem, un framework unificato che integra la gestione della memoria a lungo termine e a breve termine direttamente nella politica dell'agente attraverso azioni basate su strumenti.
Invece di fare affidamento su regole basate su trigger o gestori di memoria ausiliari, l'agente impara quando e come invocare operazioni di memoria: ADD, UPDATE, DELETE per l'archiviazione a lungo termine, e RETRIEVE, SUMMARY, FILTER per la gestione del contesto.
Utilizza una strategia RL progressiva in tre fasi. Prima, il modello impara l'archiviazione della memoria a lungo termine. Poi padroneggia la gestione del contesto a breve termine. Infine, coordina entrambi sotto impostazioni di compito complete.
Per gestire le esperienze frammentate dalle operazioni di memoria, progettano un GRPO (Group Relative Policy Optimization) passo-passo che trasforma le dipendenze tra le fasi in segnali apprendibili.
I risultati su cinque benchmark a lungo termine:
> Su Qwen2.5-7B, AgeMem ottiene un punteggio medio di 41.96 rispetto a 37.14 per Mem0, un miglioramento del 13%.
> Su Qwen3-4B, il divario si amplia: 54.31 contro 44.70. Aggiungere solo memoria a lungo termine fornisce guadagni del +10-14%.
> Aggiungere l'addestramento RL aggiunge un ulteriore +6%.
> L'intero sistema unificato con entrambi i tipi di memoria raggiunge fino al +21.7% di miglioramento rispetto ai baseline senza memoria.
La gestione della memoria unificata attraverso azioni basate su strumenti apprendibili supera i pipeline euristici frammentati, consentendo agli agenti di decidere in modo adattivo cosa ricordare e dimenticare in base alle esigenze del compito.
Documento:
...

Principali
Ranking
Preferiti
