Opus 4.5 ve GPT-5 ajanı yaklaşık insan seviyesinde %72,6 başarıya ulaşır OSWorld kıyaslamasında YZ'nin çeşitli işletim sistemleri ve günlük uygulamalarda gerçek bilgisayar görevlerini tamamlayıp tamamlayamayacağını test eden Bu gerçek bir dönüm noktası gibi hissettiriyor. Bence bilgisayar kullanan ajanların çoğu masaüstü ofis işini halledebileceği noktaya yaklaşıyoruz