Att lära sig när man ska planera LLM-agenter utbildade med dynamisk planering lär sig när de ska spendera testtid, beräkning, balansering av kostnader och prestanda. Detta är det första arbetet för att utforska utbildning av LLM-agenter för dynamisk beräkningsallokering av testtid i sekventiella beslutsfattande uppgifter.