Denne AGI-kapasitetsskalaen eksisterte ikke engang før 2020, men uansett hvilken teknologikaskade den måler, er den utrolig robust, og viser ingen tegn til at S bøyer seg før den blåser forbi menneskelig nivå. Dette er WaitButWhy-toget som suser forbi en menneskestasjon.
METR
METR20. des., 10:25
Vi anslår at Claude Opus 4.5 på våre oppgaver har en 50 % tidshorisont på rundt 4 timer og 49 minutter (95 % konfidensintervall på 1 time 49 minutter til 20 timer 25 minutter). Selv om vi fortsatt jobber med evalueringer for andre nyere modeller, er dette vår høyeste publiserte tidshorisont til dags dato.
Den nylige oppstandelsen over at AI 2027 potensielt er noen år unna, bommet fullstendig på poenget
1,04K