Ik bouw al meer dan een jaar AI Agents in productie. Hier is een veelvoorkomend probleem waar ontwikkelaars tegenaan lopen wanneer ze agents opschalen naar productie: Ze jongleren meestal tussen aparte diensten voor vectoren, gestructureerde gegevens en sessies. Drie verschillende verbindingspools. Drie back-upstrategieën. Drie monitoringdashboards. De agentlus zelf is eenvoudig met redenering, tools en geheugen, maar de infrastructuur wordt de bottleneck. Als je een schonere manier wilt zien om dit aan te pakken, heb ik een agent gebouwd met @MongoDB als de enige backend voor alles. Ik heb met hun team samengewerkt om dit met jou te delen. De opzet is eenvoudig: ↳ Begin met een PDF-document. De agent zal vragen erover beantwoorden terwijl hij eerdere gesprekken onthoudt. ↳ Chunk eerst de PDF en embed deze met het model van Voyage AI. Die embeddings gaan rechtstreeks naar MongoDB met een vectorindex. ↳ Vervolgens definieer je twee tools: één voor vectorzoekopdrachten, één voor basisberekeningen indien nodig. De agent beslist welke te gebruiken op basis van de query. ↳ Geheugen wordt opgeslagen in dezelfde database onder sessie-ID's. Elke interactie die de agent heeft, wordt teruggeschreven, zodat hij eerdere beurten kan raadplegen. ↳ De planner verbindt het geheel. Hij kijkt naar de gespreksgeschiedenis, beslist of hij een tool nodig heeft, voert die tool uit en genereert het uiteindelijke antwoord. Hier is waar de verenigde backend belangrijk is: Wanneer de agent zoekt naar context, queryt hij dezelfde database die gebruikerssessies en gestructureerde gegevens opslaat. Wanneer hij naar geheugen schrijft, beheert dezelfde MongoDB-instantie de vector embeddings. ...