Tato škála schopností AGI před rokem 2020 ani neexistovala, přesto je jakákoli technologická kaskáda, kterou měří, neuvěřitelně robustní a nejeví žádné známky zakřivení S před tím, než překročí lidskou úroveň. Toto je scénář vlaku WaitButWhy, který sviští kolem lidské stanice.
METR
METR20. 12. 10:25
Odhadujeme, že u našich úkolů má Claude Opus 4.5 časový horizont přibližně 4 hodiny 49 minut (95% interval spolehlivosti 1 hodina 49 minut až 20 hodin 25 minut). I když stále procházíme hodnocení dalších nedávných modelů, toto je náš nejvyšší zveřejněný časový horizont dosud.
Nedávné rozhořčení nad tím, že AI 2027 může být o několik let vzdálenější, úplně minulo podstatu
1,04K