Enquanto os modelos de fronteira se destacam na busca agentiva, eles são proibitivamente caros e lentos para tarefas tão intensivas em tokens. Este é um problema, uma vez que a precisão da busca tende a escalar com os tokens processados. A solução são modelos pequenos, cuidadosamente treinados com RL, adaptados a motores de busca individuais, que podem superar modelos gerais de fronteira, sendo de uma a duas ordens de magnitude mais baratos e rápidos.