He llevado mi juego de múltiples agentes de un 83% de ejecuciones exitosas a poco más del 92%. ¡Gran mejora! Aquí está la lección más importante que aprendí: Mueve tanta funcionalidad como sea posible a herramientas y deja que el LLM las use. Cuanto menos tenga que hacer el LLM, mejor. Un LLM es mucho mejor para decidir qué herramienta usar que para hacer el trabajo de esa herramienta por sí mismo, incluso cuando es un trabajo simple. Reduje un aviso de 100 líneas a 25 líneas y 3 funciones de Python que implementan toda la funcionalidad. La desventaja es más código, pero la ventaja es que la fiabilidad ha aumentado casi un 10%.