Esta escala de capacidad de AGI ni siquiera existía antes de 2020, sin embargo, cualquier cascada tecnológica que esté midiendo es increíblemente robusta y no muestra signos de curvatura S antes de superar el nivel humano. Este es el escenario del tren de WaitButWhy pasando a toda velocidad por la estación humana.
METR
METR20 dic, 10:25
Estimamos que, en nuestras tareas, Claude Opus 4.5 tiene un horizonte de tiempo del 50% de alrededor de 4 horas y 49 minutos (intervalo de confianza del 95% de 1 hora y 49 minutos a 20 horas y 25 minutos). Aunque todavía estamos trabajando en las evaluaciones de otros modelos recientes, este es nuestro horizonte de tiempo publicado más alto hasta la fecha.
La reciente indignación sobre que la IA 2027 podría estar a solo unos años de distancia estaba completamente fuera de lugar.
1,05K