Google ha appena pubblicato una guida fantastica sull'ingegneria del contesto efficace per sistemi multi-agente. Fate attenzione a questo, sviluppatori di AI! (salvatelo nei segnalibri) Ecco i miei punti chiave: Le finestre di contesto non sono il collo di bottiglia. L'ingegneria del contesto lo è. Per problemi più complessi e a lungo termine, la gestione del contesto non può essere trattata come un semplice problema di "manipolazione delle stringhe". L'approccio predefinito per gestire il contesto nei sistemi agenti di oggi rimane quello di infilare tutto nel prompt. Più storia, più token, più confusione. La maggior parte dei team tratta il contesto come un problema di concatenazione di stringhe. Ma i dump di contesto grezzo creano tre fallimenti critici: > esplosione dei costi a causa di informazioni ripetitive > degrado delle prestazioni a causa degli effetti di "perso nel mezzo" > aumento dei tassi di allucinazione quando gli agenti attribuiscono erroneamente azioni in un sistema La gestione del contesto diventa una preoccupazione architettonica insieme a storage e calcolo. Questo significa che trasformazioni esplicite sostituiscono la concatenazione di stringhe ad-hoc. Gli agenti ricevono per impostazione predefinita il contesto minimo richiesto e richiedono esplicitamente informazioni aggiuntive tramite strumenti. Sembra che il Kit di Sviluppo Agente di Google stia davvero riflettendo a fondo sulla gestione del contesto. Introduce un'architettura a livelli che tratta il contesto come "una vista compilata su un sistema con stato" piuttosto che un'attività di riempimento del prompt. Come appare questo? 1) Struttura: Il Modello a Livelli Il framework separa lo storage dalla presentazione attraverso quattro livelli distinti: 1) Il Contesto di Lavoro gestisce viste effimere per ogni invocazione. 2) La Sessione mantiene il registro degli eventi durevole, catturando ogni messaggio, chiamata di strumento e segnale di controllo....