Skok od "agenci są daleko od działania" do "okej, wąskie agenci do badań i kodowania działają całkiem dobrze" do (bardzo niedawno) "agenci ogólnego przeznaczenia są naprawdę przydatni w różnych zadaniach" był wystarczająco szybki (mniej niż rok), aby większość ludzi to przeoczyła.
Oczywiście, agenci wciąż mają wiele problemów, ale jeśli chodzi o użycie narzędzi, liczbę kroków roboczych i redukcję wskaźników błędów, to ogromny skok w porównaniu do o1-preview sprzed roku. Nawet Deep Research i różne agenty kodujące wydają się być możliwościami, których nie spodziewalibyśmy się rok temu.
158,91K