Opus 4.5 a agent GPT-5 dosahují 72,6 % úspěšnosti, přibližně na úrovni člověka na benchmarku OSWorld, který testuje, zda AI dokáže plnit skutečné počítačové úkoly napříč různými operačními systémy a běžnými aplikacemi Tohle je pro mě opravdový milník. Myslím, že se blížíme k bodu, kdy agenti používající počítače zvládnou většinu kancelářské práce u stolních počítačů