Bien que les modèles de pointe excellent dans la recherche agentique, ils sont prohibitivement coûteux et lents pour des tâches aussi intensives en tokens. C'est un problème, car la précision de la recherche a tendance à évoluer avec le nombre de tokens traités. La solution consiste en de petits modèles soigneusement entraînés par RL, adaptés à des moteurs de recherche individuels, qui peuvent surpasser les modèles de pointe généraux tout en étant de un à deux ordres de grandeur moins chers et plus rapides.