Jag upptäckte att jag designade mina AI-verktyg baklänges. Här är ett exempel. Detta var min process för bearbetning av nyhetsbrev: att läsa e-postmeddelanden, ringa en nyhetsbrevsbehandlare, extrahera företag och sedan lägga till dem i CRM. Detta involverade fyra olika steg och kostade $3.69 för varje tusen nyhetsbrev som bearbetades. Före: Bearbetningskedja för nyhetsbrev (första bilden) Sedan skapade jag ett enhetligt nyhetsbrevsverktyg som kombinerade allt med hjälp av Google Agent Development Kit, Googles ramverk för att bygga AI-agentverktyg av produktionskvalitet: (andra bilden) Varför är verktyget för enhetliga nyhetsbrev mer komplicerat? Den innehåller flera åtgärder i ett enda gränssnitt (process, sökning, extrahering, validering), implementerar tillståndshantering som spårar användningsmönster och cachelagrar resultat, har inbyggd hastighetsbegränsning och skapar strukturerade JSON-utdata med metadata i stället för oformaterad text. Men här är den kontraintuitiva delen: trots att det är mer komplext internt är det enhetliga verktyget enklare för LLM att använda eftersom det ger konsekventa, strukturerade utdata som är lättare att tolka, även om dessa utdata är längre. För att förstå effekten körde vi tester av 30 iterationer per testscenario. Resultaten visar effekten av den nya arkitekturen : (tredje bilden) Vi kunde minska tokens med 41% (p=0,01, statistiskt signifikant), vilket översattes linjärt till kostnadsbesparingar. Framgångsfrekvensen förbättrades med 8 % (p=0,03), och vi kunde träffa cachen 30 % av gångerna, vilket är ytterligare en kostnadsbesparing. Medan enskilda verktyg gav kortare, "renare" svar, tvingade de LLM att arbeta hårdare med att tolka inkonsekventa format. Strukturerade, omfattande utdata från enhetliga verktyg möjliggjorde effektivare LLM-bearbetning, trots att den var längre. Mitt arbetsflöde förlitade sig på dussintals specialiserade Ruby-verktyg för e-post, forskning och uppgiftshantering. Varje verktyg hade sitt eget gränssnitt, felhantering och utdataformat. Genom att rulla upp dem i metaverktyg blir den ultimata prestandan bättre och det finns enorma kostnadsbesparingar. Du hittar den fullständiga arkitekturen på GitHub.