Descobri que estava projetando minhas ferramentas de IA de trás para frente. Aqui está um exemplo. Esta era a minha cadeia de processamento de newsletters: ler e-mails, ligar para um processador de newsletters, extrair empresas e depois adicioná-las ao CRM. Isso envolveu quatro etapas diferentes, custando US$ 3,69 para cada mil boletins informativos processados. Antes: Cadeia de Processamento de Newsletter (primeira imagem) Em seguida, criei uma ferramenta de boletim informativo unificada que combinava tudo usando o Google Agent Development Kit, a estrutura do Google para criar ferramentas de agente de IA de nível de produção: (segunda imagem) Por que a ferramenta de boletim informativo unificada é mais complicada? Ele inclui várias ações em uma única interface (processar, pesquisar, extrair, validar), implementa o gerenciamento de estado que rastreia padrões de uso e armazena os resultados em cache, tem limitação de taxa integrada e produz saídas JSON estruturadas com metadados em vez de texto simples. Mas aqui está a parte contra-intuitiva: apesar de ser mais complexa internamente, a ferramenta unificada é mais simples para o LLM usar porque fornece saídas consistentes e estruturadas que são mais fáceis de analisar, mesmo que essas saídas sejam mais longas. Para entender o impacto, executamos testes de 30 iterações por cenário de teste. Os resultados mostram o impacto da nova arquitetura: (terceira imagem) Conseguimos reduzir os tokens em 41% (p=0,01, estatisticamente significativo), o que se traduziu linearmente em economia de custos. A taxa de sucesso melhorou em 8% (p = 0,03) e conseguimos atingir o cache 30% das vezes, o que é outra economia de custos. Embora as ferramentas individuais produzissem respostas mais curtas e "limpas", elas forçaram o LLM a trabalhar mais para analisar formatos inconsistentes. Saídas estruturadas e abrangentes de ferramentas unificadas permitiram um processamento de LLM mais eficiente, apesar de ser mais longo. Meu fluxo de trabalho contava com dezenas de ferramentas especializadas em Ruby para gerenciamento de e-mail, pesquisa e tarefas. Cada ferramenta tinha sua própria interface, tratamento de erros e formato de saída. Ao agrupá-los em metaferramentas, o desempenho final é melhor e há uma tremenda economia de custos. Você pode encontrar a arquitetura completa no GitHub.