Ik ontdekte dat ik mijn AI-tools achterstevoren aan het ontwerpen was. Hier is een voorbeeld. Dit was mijn nieuwsbriefverwerkingsketen: e-mails lezen, een nieuwsbriefverwerker aanroepen, bedrijven extraheren, en ze vervolgens aan de CRM toevoegen. Dit omvatte vier verschillende stappen, wat $3,69 kostte voor elke duizend verwerkte nieuwsbrieven. Voor: Nieuwsbriefverwerkingsketen (eerste afbeelding) Toen creëerde ik een verenigd nieuwsbrieftool dat alles combineerde met behulp van de Google Agent Development Kit, Google's framework voor het bouwen van productieklare AI-agenttools: (tweede afbeelding) Waarom is het verenigde nieuwsbrieftool ingewikkelder? Het omvat meerdere acties in één interface (verwerken, zoeken, extraheren, valideren), implementeert state management dat gebruikspatronen bijhoudt en resultaten cachet, heeft ingebouwde rate limiting, en produceert gestructureerde JSON-uitvoer met metadata in plaats van platte tekst. Maar hier is het tegenintuïtieve deel: ondanks dat het intern complexer is, is het verenigde tool eenvoudiger voor de LLM om te gebruiken omdat het consistente, gestructureerde uitvoer biedt die gemakkelijker te parseren is, ook al zijn die uitvoer langer. Om de impact te begrijpen, hebben we tests uitgevoerd van 30 iteraties per testscenario. De resultaten tonen de impact van de nieuwe architectuur: (derde afbeelding) We konden het aantal tokens met 41% verminderen (p=0.01, statistisch significant), wat lineair vertaald werd in kostenbesparingen. De slagingspercentage verbeterde met 8% (p=0.03), en we konden 30% van de tijd de cache raken, wat weer een kostenbesparing is. Hoewel individuele tools kortere, "nettere" antwoorden produceerden, dwongen ze de LLM harder te werken om inconsistente formaten te parseren. Gestructureerde, uitgebreide uitvoer van verenigde tools stelde een efficiëntere LLM-verwerking in staat, ondanks dat ze langer waren. Mijn workflow was afhankelijk van tientallen gespecialiseerde Ruby-tools voor e-mail, onderzoek en taakbeheer. Elke tool had zijn eigen interface, foutafhandeling en uitvoerformaat. Door ze samen te voegen in meta-tools, is de uiteindelijke prestatie beter, en zijn er enorme kostenbesparingen. Je kunt de complete architectuur op GitHub vinden.