Mempelajari Kapan Merencanakan Agen LLM yang dilatih dengan perencanaan dinamis mempelajari kapan harus menghabiskan komputasi waktu pengujian, menyeimbangkan biaya & kinerja. Ini adalah pekerjaan pertama yang mengeksplorasi agen LLM pelatihan untuk alokasi komputasi waktu pengujian dinamis dalam tugas pengambilan keputusan berurutan.
12,31K