Acho que é muito duro, mas este post do blog dá alguns motivos para levar o famoso gráfico de duração das tarefas do METR com um pouco de cautela.