Sementara model perbatasan unggul dalam pencarian agen, mereka sangat mahal dan lambat untuk tugas-tugas intensif token seperti itu. Ini adalah masalah, karena presisi pencarian cenderung diskalakan dengan token yang diproses. Solusinya adalah model kecil yang dilatih RL dengan hati-hati yang disesuaikan dengan mesin pencari individu, yang dapat mengungguli model perbatasan umum sekaligus menjadi satu hingga dua urutan besarnya lebih murah dan lebih cepat.