Mens frontier-modeller utmerker seg ved agentisk søk, er de uoverkommelig dyre og trege for slike token-intensive oppgaver. Dette er et problem, siden søkepresisjon har en tendens til å skaleres med tokener som behandles. Løsningen er små, nøye RL-trente modeller skreddersydd for individuelle søkemotorer, som kan utkonkurrere generelle frontlinjemodeller samtidig som de er en til to størrelsesordener billigere og raskere.