Podczas gdy modele frontier doskonale radzą sobie z agentowym wyszukiwaniem, są one nieproporcjonalnie drogie i wolne w przypadku takich zadań intensywnie wykorzystujących tokeny. To jest problem, ponieważ precyzja wyszukiwania ma tendencję do skalowania w zależności od przetworzonych tokenów. Rozwiązaniem są małe, starannie przeszkolone modele RL dostosowane do poszczególnych wyszukiwarek, które mogą przewyższać ogólne modele frontier, jednocześnie będąc od jednego do dwóch rzędów wielkości tańszymi i szybszymi.