Mentre i modelli all'avanguardia eccellono nella ricerca agentica, sono proibitivamente costosi e lenti per compiti così intensivi in termini di token. Questo è un problema, poiché la precisione della ricerca tende a scalare con i token elaborati. La soluzione sono modelli piccoli, accuratamente addestrati con RL, su misura per singoli motori di ricerca, che possono superare i modelli generali all'avanguardia pur essendo da uno a due ordini di grandezza più economici e veloci.