这个AGI能力规模在2020年之前根本不存在,但它所衡量的技术级联却极其强大,并且没有在超过人类水平之前出现S曲线的迹象。这就像是WaitButWhy列车呼啸而过人类车站的场景。
METR
METR12月20日 10:25
我们估计,在我们的任务中,Claude Opus 4.5 的 50% 时间范围大约为 4 小时 49 分钟(95% 置信区间为 1 小时 49 分钟到 20 小时 25 分钟)。虽然我们仍在对其他最近的模型进行评估,但这是我们迄今为止发布的最高时间范围。
最近对 AI 2027 可能在几年内到来的愤怒完全忽视了重点
1.03K