Questa scala di capacità AGI non esisteva nemmeno prima del 2020, eppure qualsiasi cascata tecnologica che sta misurando è incredibilmente robusta e non mostra segni di curvatura S prima di superare il livello umano. Questo è lo scenario del treno WaitButWhy che sfreccia oltre la stazione umana.
METR
METR20 dic, 10:25
Stimiamo che, per i nostri compiti, Claude Opus 4.5 abbia un orizzonte temporale del 50% di circa 4 ore e 49 minuti (intervallo di confidenza del 95% di 1 ora e 49 minuti a 20 ore e 25 minuti). Anche se stiamo ancora lavorando alle valutazioni di altri modelli recenti, questo è il nostro orizzonte temporale pubblicato più alto fino ad oggi.
L'indignazione recente riguardo al fatto che l'AI 2027 potrebbe essere a pochi anni di distanza stava completamente mancando il punto.
1,02K