LLM Opsツールの広告で、エージェントのレヴェンシュタインスコアを測定することを勧めているのをよく目にします。 エージェントの観察可能性は2010年代に留まっているように感じます