Embora os modelos de fronteira se destaquem na pesquisa de agentes, eles são proibitivamente caros e lentos para essas tarefas intensivas em tokens. Isso é um problema, pois a precisão da pesquisa tende a ser dimensionada com os tokens processados. A solução são modelos pequenos e cuidadosamente treinados em RL, adaptados a mecanismos de pesquisa individuais, que podem superar os modelos de fronteira geral, sendo uma a duas ordens de magnitude mais baratos e rápidos.