Agen Opus 4.5 dan GPT-5 mencapai keberhasilan 72,6%, kira-kira tingkat manusia pada tolok ukur OSWorld yang menguji apakah AI dapat menyelesaikan tugas komputer nyata di berbagai sistem operasi dan aplikasi sehari-hari Ini terasa seperti tonggak sejarah yang nyata. Saya yakin kita mendekati titik di mana agen pengguna komputer dapat menangani sebagian besar pekerjaan kantor desktop