Хотя передовые модели отлично справляются с агентным поиском, они чрезмерно дороги и медленны для таких задач, требующих большого количества токенов. Это проблема, поскольку точность поиска, как правило, увеличивается с количеством обработанных токенов. Решение заключается в небольших, тщательно обученных с помощью RL моделях, адаптированных к отдельным поисковым системам, которые могут превосходить общие передовые модели, оставаясь при этом в один-два порядка дешевле и быстрее.