Эта шкала возможностей AGI даже не существовала до 2020 года, но какая бы технологическая каскада она ни измеряла, она невероятно устойчива и не показывает никаких признаков S-образной кривой, прежде чем превзойти человеческий уровень. Это сценарий поезда WaitButWhy, мчащегося мимо человеческой станции.
METR
METR20 дек., 10:25
Мы оцениваем, что для наших задач Claude Opus 4.5 имеет 50%-ный временной горизонт около 4 часов 49 минут (95%-ный доверительный интервал от 1 часа 49 минут до 20 часов 25 минут). Хотя мы все еще работаем над оценками других недавних моделей, это наш самый высокий опубликованный временной горизонт на сегодняшний день.
Недавний гнев по поводу того, что AI 2027 может быть всего через несколько лет, совершенно не учитывал суть дела.
1,04K