Thang khả năng AGI này thậm chí còn không tồn tại trước năm 2020, nhưng bất kỳ chuỗi công nghệ nào mà nó đang đo lường đều cực kỳ mạnh mẽ, và không có dấu hiệu nào cho thấy nó sẽ chững lại trước khi vượt qua mức độ con người. Đây là kịch bản tàu WaitButWhy lao qua ga con người.
METR
METR10:25 20 thg 12
Chúng tôi ước tính rằng, đối với các nhiệm vụ của chúng tôi, Claude Opus 4.5 có khoảng thời gian 50% là khoảng 4 giờ 49 phút (khoảng tin cậy 95% từ 1 giờ 49 phút đến 20 giờ 25 phút). Trong khi chúng tôi vẫn đang làm việc để đánh giá các mô hình gần đây khác, đây là khoảng thời gian công bố cao nhất của chúng tôi cho đến nay.
Sự phẫn nộ gần đây về việc AI 2027 có thể chỉ còn vài năm nữa đã hoàn toàn bỏ qua vấn đề chính.
1,03K