Esta escala de capacidade de AGI nem sequer existia antes de 2020, no entanto, qualquer cascata tecnológica que está a medir é incrivelmente robusta e não mostra sinais de curvar-se em S antes de ultrapassar o nível humano. Este é o cenário do comboio WaitButWhy a passar a estação humana.
METR
METR20/12, 10:25
Estimamos que, nas nossas tarefas, o Claude Opus 4.5 tem um horizonte de tempo de 50% de cerca de 4 hrs 49 mins (intervalo de confiança de 95% de 1 hr 49 mins a 20 hrs 25 mins). Embora ainda estejamos a trabalhar nas avaliações de outros modelos recentes, este é o nosso maior horizonte de tempo publicado até à data.
A recente indignação sobre o AI 2027 potencialmente estar a apenas alguns anos de distância estava completamente a perder o ponto.
1,03K