Hoewel grensmodellen uitblinken in agentisch zoeken, zijn ze prohibitief duur en traag voor dergelijke token-intensieve taken. Dit is een probleem, aangezien de zoekprecisie doorgaans toeneemt met het aantal verwerkte tokens. De oplossing zijn kleine, zorgvuldig RL-getrainde modellen die zijn afgestemd op individuele zoekmachines, die beter kunnen presteren dan algemene grensmodellen terwijl ze één tot twee ordes van grootte goedkoper en sneller zijn.