Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Großartiges Papier über agentische Erinnerung.
LLM-Agenten benötigen sowohl Langzeit- als auch Kurzzeitgedächtnis, um komplexe Aufgaben zu bewältigen.
Derzeit behandelt der Standardansatz diese jedoch als separate Komponenten, jede mit ihren eigenen Heuristiken, Controllern und Optimierungsstrategien.
Aber Gedächtnis ist kein unabhängiges System. Es ist ein kognitiver Prozess, der entscheidet, was gespeichert, abgerufen, zusammengefasst und vergessen wird.
Diese neue Forschung führt AgeMem ein, ein einheitliches Framework, das das Management von Langzeit- und Kurzzeitgedächtnis direkt in die Richtlinie des Agenten durch werkzeugbasierte Aktionen integriert.
Anstatt sich auf triggerbasierte Regeln oder zusätzliche Gedächtnismanager zu verlassen, lernt der Agent, wann und wie er Gedächtnisoperationen ausführt: ADD, UPDATE, DELETE für die Langzeitspeicherung und RETRIEVE, SUMMARY, FILTER für das Kontextmanagement.
Es verwendet eine dreistufige progressive RL-Strategie. Zuerst lernt das Modell die Langzeitspeicherung. Dann beherrscht es das Kurzzeitkontextmanagement. Schließlich koordiniert es beide unter vollständigen Aufgabenstellungen.
Um die fragmentierten Erfahrungen aus Gedächtnisoperationen zu bewältigen, entwerfen sie ein schrittweises GRPO (Group Relative Policy Optimization), das Abhängigkeiten zwischen den Phasen in erlernbare Signale umwandelt.
Die Ergebnisse über fünf Langzeit-Benchmarks:
> Auf Qwen2.5-7B erreicht AgeMem einen Durchschnittswert von 41,96 im Vergleich zu 37,14 für Mem0, eine Verbesserung von 13%.
> Auf Qwen3-4B weitet sich die Lücke: 54,31 vs 44,70. Das Hinzufügen von Langzeitgedächtnis allein bietet +10-14% Gewinne.
> Das Hinzufügen von RL-Training bringt weitere +6%.
> Das vollständige einheitliche System mit beiden Gedächtnistypen erzielt bis zu +21,7% Verbesserung gegenüber Baselines ohne Gedächtnis.
Das einheitliche Gedächtnismanagement durch erlernbare werkzeugbasierte Aktionen übertrifft fragmentierte heuristische Pipelines und ermöglicht es Agenten, adaptiv zu entscheiden, was sie basierend auf den Anforderungen der Aufgabe erinnern und vergessen sollen.
Papier:
...

Top
Ranking
Favoriten
