Lernen, wann man planen sollte LLM-Agenten, die mit dynamischer Planung trainiert wurden, lernen, wann sie Rechenleistung zur Testzeit einsetzen sollten, um Kosten und Leistung auszubalancieren. Dies ist die erste Arbeit, die das Training von LLM-Agenten für die dynamische Zuteilung von Rechenressourcen zur Testzeit in sequenziellen Entscheidungsaufgaben untersucht.
12,31K