Zatímco hraniční modely vynikají v agentním vyhledávání, jsou neúměrně drahé a pomalé pro úkoly náročné na tokeny. To je problém, protože přesnost vyhledávání má tendenci škálovat se zpracovanými tokeny. Řešením jsou malé, pečlivě natrénované modely natrénované na míru jednotlivým vyhledávačům, které mohou překonat obecné hraniční modely a přitom být o jeden až dva řády levnější a rychlejší.