Ho portato il mio gioco multi-agente da un 83% di esecuzioni riuscite a poco più del 92%. Un enorme miglioramento! Ecco la lezione più importante che ho imparato: Sposta quanta più funzionalità possibile negli strumenti e lascia che l'LLM li utilizzi. Meno cose deve fare l'LLM, meglio è. Un LLM è molto migliore nel decidere quale strumento utilizzare piuttosto che fare il lavoro di quello strumento da solo, anche quando si tratta di un lavoro semplice. Ho ridotto un prompt di 100 righe a 25 righe e 3 funzioni Python che implementano tutta la funzionalità. Lo svantaggio è più codice, ma il vantaggio è che l'affidabilità è aumentata di quasi il 10%.