Tätä AGI-kykyasteikkoa ei edes ollut olemassa ennen vuotta 2020, mutta mikä tahansa teknologinen ketju, jota se mittaa, on uskomattoman kestävä eikä osoita merkkejä S-kaaresta ennen kuin se ylittää ihmisen tason. Tämä on WaitButWhy -juna, joka kiitäe ihmisten aseman ohi.
METR
METR20.12. klo 10.25
Arvioimme, että tehtävissämme Claude Opus 4.5:llä on 50 % aikahorisontti noin 4 tuntia 49 minuuttia (95 % luottamusväli 1 tunti 49 minuuttia – 20 tuntia 25 minuuttia). Vaikka työskentelemme vielä muiden viimeaikaisten mallien arvioinneissa, tämä on tähän mennessä korkein julkaistu aikahorisonttimme.
Viimeaikainen suuttumus siitä, että AI 2027 saattaa olla muutaman vuoden päässä, meni täysin ohi asian ytimen.
1,04K