95% da engenharia de IA é apenas engenharia de contexto. Todo mundo é obcecado por modelos melhores, enquanto o contexto continua sendo o verdadeiro gargalo. Até o melhor modelo do mundo vai te dar lixo se você entregar informações erradas. Aqui está o que a maioria das pessoas deixa passar: Engenharia de contexto não é apenas sobre RAG, memória ou agentes. É a arte e a ciência de entregar a informação certa, no formato certo, na hora certa, para o seu LLM. Pense no que você realmente precisa: ↳ Recuperação para buscar documentos relevantes ↳ Memória de curto prazo para acompanhar conversas ↳ Memória de longo prazo para lembrar a preferência do usuário ↳ Agentes para orquestrar tudo ↳ Ferramentas para ampliar capacidades São 5 sistemas diferentes que você precisa construir, conectar e manter. Tenho montado com o Pixeltable recentemente, e é uma abordagem interessante para esse problema. É open-source e trata a engenharia de contexto como um problema unificado de dados: A ideia é simples: em vez de unir um banco de dados vetorial, um banco SQL, um serviço de embedding e um framework de agentes, tudo vive em um único sistema. Seus documentos, embeddings, histórico de conversas e saídas de agentes são todos apenas tabelas. Embeddings são colunas computadas que atualizam automaticamente. A busca vetorial funciona junto com suas operações regulares de dados. O que acho útil: ↳ Pipelines RAG sem gerenciar bancos de dados separados ↳ Memória de longo prazo por meio de busca vetorial sobre conversas históricas...