opus 4.5 et l'agent gpt-5 atteignent un taux de réussite de 72,6 %, à peu près au niveau humain sur le benchmark OSWorld qui teste si l'IA peut accomplir de vraies tâches informatiques sur divers systèmes d'exploitation et applications quotidiennes cela semble être un véritable jalon. je crois que nous approchons du moment où les agents utilisant des ordinateurs peuvent gérer la plupart des travaux de bureau sur desktop.