Leren Wanneer te Plannen LLM-agenten die zijn getraind met dynamische planning leren wanneer ze test-tijd rekenkracht moeten besteden, waarbij ze kosten en prestaties in balans brengen. Dit is het eerste werk dat het trainen van LLM-agenten voor dynamische toewijzing van rekenkracht tijdens de testtijd in sequentiële besluitvormingsopdrachten verkent.