Mientras que los modelos de frontera sobresalen en la búsqueda agente, son prohibitivamente caros y lentos para tareas tan intensivas en tokens. Este es un problema, ya que la precisión de búsqueda tiende a escalar con los tokens procesados. La solución son modelos pequeños, cuidadosamente entrenados con RL, adaptados a motores de búsqueda individuales, que pueden superar a los modelos generales de frontera mientras son de uno a dos órdenes de magnitud más baratos y rápidos.