Estou construindo Agentes de IA em produção há mais de um ano. Aqui está um problema comum que os desenvolvedores enfrentam quando escalam agentes para produção: Eles normalmente alternam entre serviços separados para vetores, dados estruturados e sessões. Três pools de conexões diferentes. Três estratégias de reserva. Três painéis de monitoramento. O loop de agentes em si é simples com raciocínio, ferramentas e memória, mas a infraestrutura se torna o gargalo. Se quiser ver uma forma mais limpa de lidar com isso, eu criei um agente usando @MongoDB como backend único para tudo. Trabalhei com a equipe deles para compartilhar isso com você. A premissa é simples: ↳ Comece com um documento PDF. O agente responderá perguntas sobre isso enquanto lembra de conversas anteriores. ↳ Primeiro, faça um segmento do PDF e incorpore usando o modelo do Voyage AI. Esses embeddings vão direto para o MongoDB com um índice vetorial. ↳ Então você define duas ferramentas: uma para busca vetorial, outra para cálculos básicos, se necessário. O agente decide qual usar com base na consulta. ↳ A memória é armazenada no mesmo banco de dados sob IDs de sessão. Cada interação do agente é escrita de volta, para que ele possa referenciar turnos anteriores. ↳ O planejador amarra tudo. Ele analisa o histórico de conversas, decide se precisa de uma ferramenta, executa essa ferramenta e gera a resposta final. Aqui é onde o backend unificado importa: Quando o agente busca contexto, ele consulta o mesmo banco de dados que armazena sessões de usuário e dados estruturados. Quando escreve na memória, a mesma instância do MongoDB está lidando com os embeddings vetoriais. ...