Aprendendo Quando Planejar Agentes LLM treinados com planejamento dinâmico aprendem quando gastar recursos computacionais em tempo de teste, equilibrando custo e desempenho. Este é o primeiro trabalho a explorar o treinamento de agentes LLM para alocação dinâmica de recursos computacionais em tempo de teste em tarefas de tomada de decisão sequencial.