Buduję agentów AI w produkcji od ponad roku. Oto powszechny problem, z którym borykają się deweloperzy, gdy skalują agentów do produkcji: Zazwyczaj balansują między oddzielnymi usługami dla wektorów, danych strukturalnych i sesji. Trzy różne pule połączeń. Trzy strategie zapasowe. Trzy pulpity monitorujące. Pętla agenta sama w sobie jest prosta z rozumowaniem, narzędziami i pamięcią, ale infrastruktura staje się wąskim gardłem. Jeśli chcesz zobaczyć czystszy sposób na obsługę tego, zbudowałem agenta używając @MongoDB jako jednego backendu dla wszystkiego. Współpracowałem z ich zespołem, aby podzielić się tym z tobą. Konfiguracja jest prosta: ↳ Zacznij od dokumentu PDF. Agent odpowie na pytania dotyczące tego dokumentu, pamiętając wcześniejsze rozmowy. ↳ Najpierw podziel PDF na fragmenty i osadź go używając modelu Voyage AI. Te osadzenia trafiają bezpośrednio do MongoDB z indeksem wektorowym. ↳ Następnie definiujesz dwa narzędzia: jedno do wyszukiwania wektorowego, drugie do podstawowych obliczeń, jeśli zajdzie taka potrzeba. Agent decyduje, które z nich użyć w zależności od zapytania. ↳ Pamięć jest przechowywana w tej samej bazie danych pod identyfikatorami sesji. Każda interakcja agenta jest zapisywana, aby mógł odwołać się do wcześniejszych tur. ↳ Planista łączy to wszystko. Patrzy na historię rozmowy, decyduje, czy potrzebuje narzędzia, wykonuje to narzędzie i generuje ostateczną odpowiedź. Oto, dlaczego zjednoczony backend ma znaczenie: Gdy agent szuka kontekstu, zapytuje tę samą bazę danych, która przechowuje sesje użytkowników i dane strukturalne. Gdy zapisuje w pamięci, ta sama instancja MongoDB obsługuje osadzenia wektorowe. ...