有趣的是,圖靈測試曾經看起來像是 AI 的一個巨大無法逾越的成就,然後突然間 AI 通過了它,現在只值得專注於這個測試的許多(真實的)缺陷作為思考的衡量標準,心智理論也是如此。ARC-AGI 也會發生同樣的事情。
顯示: 1) 當我們將智力、創造力、意識等測試應用於非人類時,這些測試有多糟糕 2) 我們對 AI 的進步調整得有多快 3) 我們對於擁有「類人智力」的定義有不良的衡量標準和描述,這使得測量結果令人不滿意
221