Ta skala zdolności AGI nie istniała nawet przed 2020 rokiem, a jednak jakikolwiek kaskadowy rozwój technologii, który mierzy, jest niezwykle solidny i nie wykazuje oznak zakrzywienia S przed przekroczeniem poziomu ludzkiego. To jest scenariusz pociągu WaitButWhy, który mknie obok stacji ludzkiej.
METR
METR20 gru, 10:25
Szacujemy, że w naszych zadaniach Claude Opus 4.5 ma 50%-owy horyzont czasowy wynoszący około 4 godziny 49 minut (95% przedział ufności od 1 godziny 49 minut do 20 godzin 25 minut). Chociaż wciąż pracujemy nad ocenami innych niedawnych modeli, to jest nasz najwyższy opublikowany horyzont czasowy do tej pory.
Ostatnie oburzenie związane z tym, że AI 2027 może być za kilka lat, całkowicie umknęło sednu sprawy.
1,03K