opus 4.5 и агент gpt-5 достигают 72.6% успеха, что примерно соответствует уровню человека по бенчмарку OSWorld, который проверяет, может ли ИИ выполнять реальные компьютерные задачи на различных операционных системах и повседневных приложениях это кажется настоящим достижением. я верю, что мы приближаемся к моменту, когда агенты, использующие компьютеры, смогут справляться с большинством офисной работы на настольных ПК