Imparare Quando Pianificare Gli agenti LLM addestrati con pianificazione dinamica imparano quando spendere risorse computazionali durante il test, bilanciando costo e prestazioni. Questo è il primo lavoro a esplorare l'addestramento di agenti LLM per l'allocazione dinamica delle risorse computazionali durante il test in compiti di decisione sequenziale.
12,3K