حقق أوبوس 4.5 وGPT-5 Agent نجاحا بنسبة 72.6٪، وهو تقريبا مستوى بشري على اختبار OSWorld الذي يختبر ما إذا كان الذكاء الاصطناعي قادرا على إتمام مهام الحاسوب الحقيقية عبر أنظمة التشغيل المختلفة والتطبيقات اليومية هذا يبدو وكأنه إنجاز حقيقي. أعتقد أننا نقترب من نقطة يمكن فيها للوكلاء الذين يستخدمون الحاسوب التعامل مع معظم أعمال مكتبي سطح المكتب