OPUS 4.5 ja GPT-5 Agent saavuttavat 72,6 % onnistumisen, suunnilleen ihmisen tasolla OSWorld-testissä, joka testaa, pystyykö tekoäly suorittamaan oikeita tietokonetehtäviä eri käyttöjärjestelmissä ja arkisovelluksissa Tämä tuntuu todelliselta virstanpylväältä. Uskon, että olemme lähellä pistettä, jossa tietokoneella varustetut agentit pystyvät hoitamaan suurimman osan työpöytätoimistotyöstä