Uczenie się, kiedy planować Agenci LLM szkoleni z dynamicznym planowaniem uczą się, kiedy wydawać zasoby obliczeniowe w czasie testu, równoważąc koszty i wydajność. To pierwsza praca, która bada szkolenie agentów LLM do dynamicznego przydzielania zasobów obliczeniowych w czasie testu w zadaniach podejmowania decyzji sekwencyjnych.