Am scris o postare pe blog despre cum am construit un subagent auto-testant bazat pe REPL, care să treacă de la 20 de minute la > 200 de minute de autonomie în Agent 3 :) principalul lucru pe care voiam să-l rezolvăm era problema LLM-urilor care generau aplicații care păreau să funcționeze, dar care de fapt erau doar mock-uri de înaltă fidelitate
Replit se ocupă cu crearea de aplicații funcționale și se pare că oferirea agentului mijloacelor de auto-verificare este una dintre principalele deblocări pentru o autonomie mai mare în agenți
Prin construirea unei interfețe asemănătoare unui notebook pentru agent, am descoperit că acest lucru a deblocat un mod iterativ de testare foarte uman, flexibil și scalabil din punct de vedere al costurilor pentru implementare în producție
42