Wenn du nicht sehen kannst, was ein Agent tut, kannst du es nicht verbessern, du kannst es nicht debuggen und du kannst ihm nicht vertrauen.
Es ist verrückt, wie viele Teams Agenten bauen, ohne zu verstehen, was sie tun.
Wörtlich NULL Beobachtbarkeit.
Das ist wahrscheinlich eine der ersten Fragen, die ich jedem neuen Team stelle, das ich treffe:
Kannst du mir die Spuren einiger Ausführungen deiner Agenten zeigen?
Nada. Null. Nichts.
Große Sprachmodelle treffen ständig schlechte Entscheidungen.
Agenten scheitern, und du wirst es nicht merken, bis sich jemand beschwert.
Mindestens jeder Agent, den du baust, sollte Spuren erzeugen, die den vollständigen Anfragefluss, die Latenzanalyse und die systemweiten Leistungskennzahlen zeigen.
Das allein wird 80 % der Betriebsprobleme aufdecken.
Aber idealerweise kannst du etwas viel Besseres tun und all das Folgende erfassen:
• Modellinteraktionen
• Token-Nutzung
• Timing- und Leistungsmetadaten
• Ereignisausführung
Wenn du zuverlässige Agenten möchtest, ist Beobachtbarkeit nicht optional.