DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Utmärkt artikel om Agentic Memory. LLM-agenter behöver både långtids- och korttidsminne för att hantera komplexa uppgifter. Dock behandlas dessa som separata komponenter idag av standardmetoden, var och en med sina egna heuristiker, styrsystem och optimeringsstrategier. Men minnet är inte två oberoende system. Det är en kognitiv process som bestämmer vad som ska lagras, hämtas, sammanfattas och glömmas. Denna nya forskning introducerar AgeMem, ett enhetligt ramverk som integrerar långtids- och korttidsminneshantering direkt i agentens policy genom verktygsbaserade åtgärder. Istället för att förlita sig på triggerbaserade regler eller hjälpminneshanterare lär sig agenten när och hur minnesoperationer ska anropas: LÄGG TILL, UPPDATERA, TA BORT för långtidslagring och HÄMTA, SAMMANFATTNING, FILTER för kontexthantering. Den använder en trestegs progressiv RL-strategi. För det första lär sig modellen långtidsminneslagring. Sedan behärskar den kortsiktig kontexthantering. Slutligen koordinerar den båda under fullständiga uppgiftsinställningar. För att hantera de fragmenterade upplevelserna från minnesoperationer utformar de en stegvis GRPO (Group Relative Policy Optimization) som omvandlar tvärstegsberoenden till lärbara signaler. Resultaten över fem långsiktiga riktmärken: > På Qwen2,5-7B uppnår AgeMem ett genomsnittligt resultat på 41,96 jämfört med 37,14 för Mem0, en förbättring på 13 %. > På Qwen3-4B ökar avståndet: 54,31 mot 44,70. Att lägga till enbart långtidsminne ger +10–14 % vinst. > Att lägga till RL-träning ger ytterligare +6%. > Det fullständiga enhetliga systemet med båda minnestyperna uppnår upp till +21,7 % förbättring jämfört med minnesfria baslinjer. Den enhetliga minneshanteringen genom inlärningsbara verktygsbaserade åtgärder överträffar fragmenterade heuristiska pipelines, vilket gör det möjligt för agenter att adaptivt avgöra vad de ska komma ihåg och glömma baserat på uppgiftens krav. Papper: ...

Topp

Rankning

Favoriter