Lære når du skal planlegge LLM-agenter som er opplært med dynamisk planlegging, lærer når de skal bruke testtid på å beregne og balansere kostnader og ytelse. Dette er det første arbeidet som utforsker opplæring av LLM-agenter for dynamisk databehandlingsallokering i testtid i sekvensielle beslutningsoppgaver.
12,3K