このAGI能力スケールは2020年以前には存在しませんでしたが、測定されている技術の連鎖は非常に堅牢で、人間のレベルを超える前にSが曲がる兆候は全くありません。これは「待っていれば、なぜ」列車が人間の駅を猛スピードで通過するシナリオだ。
METR
METR12月20日 10:25
私たちの課題では、Claude Opus 4.5の50%時間範囲は約4時間49分(95%信頼区間は1時間49分から20時間25分)と推定しています。他の最近のモデルの評価も進めている最中ですが、これがこれまでで最も高い公表期間です。
AI 2027が数年先になるかもしれないという最近の怒りは、本質を見誤っていました
1.04K