DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Ich habe entdeckt, dass ich meine AI-Tools rückwärts entworfen habe. Hier ist ein Beispiel. Dies war meine Newsletter-Verarbeitungskette: E-Mails lesen, einen Newsletter-Prozessor aufrufen, Unternehmen extrahieren und sie dann zum CRM hinzufügen. Dies umfasste vier verschiedene Schritte und kostete 3,69 $ für jede tausend verarbeiteten Newsletter. Vorher: Newsletter-Verarbeitungskette (erstes Bild) Dann habe ich ein einheitliches Newsletter-Tool erstellt, das alles kombiniert, indem ich das Google Agent Development Kit, Googles Framework zum Erstellen von produktionsreifen AI-Agenten-Tools, verwendet habe: (zweites Bild) Warum ist das einheitliche Newsletter-Tool komplizierter? Es umfasst mehrere Aktionen in einer einzigen Schnittstelle (verarbeiten, suchen, extrahieren, validieren), implementiert ein Zustandsmanagement, das Nutzungsmuster verfolgt und Ergebnisse zwischenspeichert, hat eine eingebaute Ratenbegrenzung und produziert strukturierte JSON-Ausgaben mit Metadaten anstelle von einfachem Text. Aber hier ist der kontraintuitive Teil: Trotz der internen Komplexität ist das einheitliche Tool einfacher für das LLM zu verwenden, da es konsistente, strukturierte Ausgaben liefert, die leichter zu parsen sind, auch wenn diese Ausgaben länger sind. Um die Auswirkungen zu verstehen, haben wir Tests mit 30 Iterationen pro Testszenario durchgeführt. Die Ergebnisse zeigen die Auswirkungen der neuen Architektur: (drittes Bild) Wir konnten die Tokens um 41 % reduzieren (p=0,01, statistisch signifikant), was sich linear in Kosteneinsparungen übersetzte. Die Erfolgsquote verbesserte sich um 8 % (p=0,03), und wir konnten in 30 % der Fälle auf den Cache zugreifen, was eine weitere Kosteneinsparung darstellt. Während einzelne Tools kürzere, "sauberere" Antworten produzierten, zwangen sie das LLM, härter zu arbeiten, um inkonsistente Formate zu parsen. Strukturierte, umfassende Ausgaben von einheitlichen Tools ermöglichten eine effizientere LLM-Verarbeitung, obwohl sie länger waren. Mein Workflow basierte auf Dutzenden von spezialisierten Ruby-Tools für E-Mail, Forschung und Aufgabenmanagement. Jedes Tool hatte seine eigene Schnittstelle, Fehlerbehandlung und Ausgabeformat. Durch die Zusammenführung in Meta-Tools ist die letztliche Leistung besser, und es gibt enorme Kosteneinsparungen. Die vollständige Architektur finden Sie auf GitHub.

Top

Ranking

Favoriten