Opus 4.5およびGPT-5エージェントは72.6%の成功率を達成しており、これはほぼ人間レベルです OSWorldベンチマークで、AIがさまざまなオペレーティングシステムや日常的なアプリで実際のコンピュータタスクを完了できるかどうかを検証しています これは本当に大きな節目のように感じます。 コンピューターを使うエージェントがほとんどのデスクトップオフィス作業をこなせるようになる段階に近づいていると信じています