Opus 4.5 y el agente GPT-5 alcanzan un 72,6% de éxito, aproximadamente a nivel humano en el benchmark OSWorld que evalúa si la IA puede realizar tareas reales del ordenador en varios sistemas operativos y aplicaciones cotidianas Esto parece un hito real. Creo que estamos llegando al punto en que los agentes que usan ordenadores pueden encargarse de la mayoría del trabajo de oficina de escritorio