Você está em uma entrevista para engenheiro de IA no Google. O entrevistador pergunta: "Nossos dados estão espalhados por várias fontes (Salesforce, Gmail, Drive, etc.) Como você construiria um motor de consulta unificado sobre ele?" Você: "Vou incorporar tudo em um banco de dados vetorial e fazer RAG." Entrevista encerrada! Muitos desenvolvedores ainda acham que a recuperação de contexto é um pipeline linear: Bloco → Embed→ Recuperar → Gerar Isso funciona muito bem para demos simples, mas sistemas de produção precisam de algo fundamentalmente diferente. Para entender melhor, considere esta pergunta: "Compare nosso desempenho de vendas no quarto trimestre na região de Chicago com as projeções do ano passado formuladas em uma reunião com as partes interessadas." Essa única consulta exige: - Dados de vendas do seu banco de dados SQL - Relações de grafos (hierarquia organizacional) - Busca vetorial sobre relatórios de projeção - Filtragem baseada em tempo (quarto trimestre deste ano vs ano passado) - Verificações de permissões (para autorização de usuário) ...