Ho costruito agenti AI in produzione per oltre un anno. Ecco un problema comune che gli sviluppatori affrontano quando scalano gli agenti in produzione: Di solito si destreggiano tra servizi separati per vettori, dati strutturati e sessioni. Tre diversi pool di connessione. Tre strategie di backup. Tre dashboard di monitoraggio. Il ciclo dell'agente stesso è semplice con ragionamento, strumenti e memoria, ma l'infrastruttura diventa il collo di bottiglia. Se vuoi vedere un modo più pulito per gestire questo, ho costruito un agente utilizzando @MongoDB come backend unico per tutto. Ho lavorato con il loro team per condividerlo con te. La configurazione è semplice: ↳ Inizia con un documento PDF. L'agente risponderà a domande su di esso mentre ricorda le conversazioni passate. ↳ Prima, suddividi il PDF e incorporalo utilizzando il modello di Voyage AI. Quegli embedding vanno direttamente in MongoDB con un indice vettoriale. ↳ Poi definisci due strumenti: uno per la ricerca vettoriale, uno per calcoli di base se necessario. L'agente decide quale utilizzare in base alla query. ↳ La memoria viene memorizzata nello stesso database sotto gli ID di sessione. Ogni interazione che l'agente ha viene scritta di nuovo, in modo che possa fare riferimento ai turni precedenti. ↳ Il pianificatore unisce il tutto. Guarda la cronologia delle conversazioni, decide se ha bisogno di uno strumento, esegue quello strumento e genera la risposta finale. Ecco dove il backend unificato è importante: Quando l'agente cerca contesto, sta interrogando lo stesso database che memorizza le sessioni utente e i dati strutturati. Quando scrive in memoria, la stessa istanza di MongoDB gestisce gli embedding vettoriali. ...