Conseguí que mi juego multiagente pasara de un 83% de ejecuciones exitosas a un poco más del 92%. ¡Gran mejora! Aquí está la lección más importante que aprendí: Mueva la mayor cantidad de funcionalidad posible a las herramientas y deje que el LLM las use. Cuanto menos tenga que hacer el LLM, mejor. Un LLM es mucho mejor para decidir qué herramienta usar que hacer el trabajo de esa herramienta por sí misma, incluso cuando es un trabajo simple. Reduje un indicador de 100 líneas a 25 líneas y 3 funciones de Python que implementan toda la funcionalidad. La desventaja es más código, pero la ventaja es que la confiabilidad ha aumentado en casi un 10%.