O Google acaba de publicar um guia incrível sobre engenharia de contexto eficaz para sistemas multi-agente. Prestem atenção a este, desenvolvedores de IA! (adicionem aos favoritos) Aqui estão os meus principais pontos: As janelas de contexto não são o gargalo. A engenharia de contexto é. Para problemas mais complexos e de longo prazo, a gestão de contexto não pode ser tratada como um simples problema de "manipulação de strings". A abordagem padrão para lidar com contexto em sistemas de agentes hoje continua a ser enfiar tudo no prompt. Mais história, mais tokens, mais confusão. A maioria das equipas trata o contexto como um problema de concatenação de strings. Mas os despejos de contexto bruto criam três falhas críticas: > explosão de custos devido a informações repetitivas > degradação de desempenho devido a efeitos de "perdido no meio" > aumento nas taxas de alucinação quando os agentes atribuem erroneamente ações em um sistema A gestão de contexto torna-se uma preocupação arquitetônica ao lado do armazenamento e computação. Isso significa que transformações explícitas substituem a concatenação de strings ad-hoc. Os agentes recebem o contexto mínimo necessário por padrão e solicitam explicitamente informações adicionais através de ferramentas. Parece que o Kit de Desenvolvimento de Agentes do Google está realmente pensando profundamente sobre a gestão de contexto. Ele introduz uma arquitetura em camadas que trata o contexto como "uma visão compilada sobre um sistema com estado" em vez de uma atividade de enchimento de prompt. Como isso se parece? 1) Estrutura: O Modelo em Camadas A estrutura separa o armazenamento da apresentação em quatro camadas distintas: 1) O Contexto de Trabalho lida com visões efémeras por invocação. 2) A Sessão mantém o log de eventos durável, capturando cada mensagem, chamada de ferramenta e sinal de controle....