DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Ottimo documento sulla Memoria Agente. Gli agenti LLM hanno bisogno sia di memoria a lungo termine che a breve termine per gestire compiti complessi. Tuttavia, l'approccio predefinito di oggi tratta questi come componenti separati, ognuno con le proprie euristiche, controllori e strategie di ottimizzazione. Ma la memoria non è due sistemi indipendenti. È un unico processo cognitivo che decide cosa memorizzare, recuperare, riassumere e dimenticare. Questa nuova ricerca introduce AgeMem, un framework unificato che integra la gestione della memoria a lungo termine e a breve termine direttamente nella politica dell'agente attraverso azioni basate su strumenti. Invece di fare affidamento su regole basate su trigger o gestori di memoria ausiliari, l'agente impara quando e come invocare operazioni di memoria: ADD, UPDATE, DELETE per l'archiviazione a lungo termine, e RETRIEVE, SUMMARY, FILTER per la gestione del contesto. Utilizza una strategia RL progressiva in tre fasi. Prima, il modello impara l'archiviazione della memoria a lungo termine. Poi padroneggia la gestione del contesto a breve termine. Infine, coordina entrambi sotto impostazioni di compito complete. Per gestire le esperienze frammentate dalle operazioni di memoria, progettano un GRPO (Group Relative Policy Optimization) passo-passo che trasforma le dipendenze tra le fasi in segnali apprendibili. I risultati su cinque benchmark a lungo termine: > Su Qwen2.5-7B, AgeMem ottiene un punteggio medio di 41.96 rispetto a 37.14 per Mem0, un miglioramento del 13%. > Su Qwen3-4B, il divario si amplia: 54.31 contro 44.70. Aggiungere solo memoria a lungo termine fornisce guadagni del +10-14%. > Aggiungere l'addestramento RL aggiunge un ulteriore +6%. > L'intero sistema unificato con entrambi i tipi di memoria raggiunge fino al +21.7% di miglioramento rispetto ai baseline senza memoria. La gestione della memoria unificata attraverso azioni basate su strumenti apprendibili supera i pipeline euristici frammentati, consentendo agli agenti di decidere in modo adattivo cosa ricordare e dimenticare in base alle esigenze del compito. Documento: ...

Principali

Ranking

Preferiti