DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Akshay 🚀

Simplifiez pour vous les LLM, les agents d’IA, le RAG et l’apprentissage automatique ! • Co-fondateur @dailydoseofds_• BITS Pilani • 3 Brevets • ex-Ingénieur IA @ LightningAI

J'ai construit des agents IA en production depuis plus d'un an. Voici un problème courant auquel les développeurs sont confrontés lorsqu'ils mettent des agents en production : Ils jonglent généralement entre des services séparés pour les vecteurs, les données structurées et les sessions. Trois pools de connexions différents. Trois stratégies de sauvegarde. Trois tableaux de bord de surveillance. La boucle de l'agent elle-même est simple avec le raisonnement, les outils et la mémoire, mais l'infrastructure devient le goulot d'étranglement. Si vous voulez voir une manière plus propre de gérer cela, j'ai construit un agent en utilisant @MongoDB comme backend unique pour tout. J'ai travaillé avec leur équipe pour partager cela avec vous. La configuration est simple : ↳ Commencez avec un document PDF. L'agent répondra à des questions à son sujet tout en se souvenant des conversations passées. ↳ Tout d'abord, divisez le PDF et intégrez-le en utilisant le modèle de Voyage AI. Ces intégrations vont directement dans MongoDB avec un index vectoriel. ↳ Ensuite, vous définissez deux outils : un pour la recherche vectorielle, un pour des calculs de base si nécessaire. L'agent décide lequel utiliser en fonction de la requête. ↳ La mémoire est stockée dans la même base de données sous des identifiants de session. Chaque interaction que l'agent a est écrite, afin qu'il puisse se référer aux tours précédents. ↳ Le planificateur relie le tout. Il examine l'historique des conversations, décide s'il a besoin d'un outil, exécute cet outil et génère la réponse finale. Voici où le backend unifié est important : Lorsque l'agent recherche un contexte, il interroge la même base de données qui stocke les sessions utilisateur et les données structurées. Lorsqu'il écrit dans la mémoire, la même instance de MongoDB gère les intégrations vectorielles. J'ai enveloppé cela dans une interface utilisateur Streamlit pour observer le fonctionnement de l'agent. Lorsque j'envoie une requête, cela vous montre quel outil il a choisi, ce qu'il a récupéré et comment il a raisonné pour arriver à la réponse. L'architecture reste flexible puisque vous pouvez facilement échanger n'importe quel modèle d'intégration ou LLM de votre choix. Et lorsque vous êtes prêt à expédier, vous gérez une seule base de données. Pas trois. Une approche similaire est également détaillée dans le Hub d'apprentissage IA de MongoDB. Si vous souhaitez approfondir d'autres modèles d'ingénierie IA comme celui-ci… Il propose des parcours auto-dirigés couvrant les fondamentaux de la recherche vectorielle, les architectures RAG, la gestion de la mémoire pour les agents, et des tutoriels pratiques avec LangGraph .js. J'ai partagé le dépôt complet par #MongoDB dans les réponses.

Meilleurs

Classement

Favoris