95% da engenharia de AI é apenas engenharia de contexto. Todos estão obcecados por melhores modelos enquanto o contexto continua a ser o verdadeiro gargalo. Mesmo o melhor modelo do mundo te dará lixo se você lhe passar a informação errada. Aqui está o que a maioria das pessoas perde: A engenharia de contexto não se trata apenas de RAG ou memória ou agentes. É a arte e a ciência de entregar a informação certa, no formato certo, no momento certo, para o seu LLM. Pense sobre o que você realmente precisa: ↳ Recuperação para buscar documentos relevantes ↳ Memória de curto prazo para acompanhar conversas ↳ Memória de longo prazo para lembrar preferências do usuário ↳ Agentes para orquestrar tudo ↳ Ferramentas para estender capacidades Isso são 5 sistemas diferentes que você precisa construir, conectar e manter. Eu tenho trabalhado com o Pixeltable recentemente, e é uma abordagem interessante para esse problema. É open-source e trata a engenharia de contexto como um problema de dados unificado: A ideia é simples: em vez de costurar um banco de dados vetorial, um banco de dados SQL, um serviço de embeddings e uma estrutura de agentes, tudo vive em um único sistema. Seus documentos, embeddings, histórico de conversas e saídas de agentes são todos apenas tabelas. Embeddings são colunas computadas que se atualizam automaticamente. A busca vetorial funciona ao lado das suas operações de dados regulares. O que eu acho útil: ↳ Pipelines RAG sem gerenciar bancos de dados separados ↳ Memória de longo prazo através da busca vetorial sobre conversas históricas...