Dwarkesh 用這個想法進行烹飪: -RLVR 矛盾:實驗室花費數十億預先培養特定技能,這引發了一種根本的緊張關係:如果我們接近人類學習者,那麼所有這些預訓練都是毫無意義的,因為他們會在工作中學習。 -人類勞動的真正價值:我們不需要為每個微任務定制訓練管道;目前的 AI 需要。 -擴散滯後 = 應對:如果模型是人類等效的,它們的整合速度會比員工快 [這個可以辯論 - 數據來源、商業對可靠性的信心、替代恐懼等都可以合理地延遲 AI 部署;但我們仍然會相信這是一個更好的選擇,而這還不是真的,所以我認為這一點成立]。 -目標移動已經發生:我們解決了我們認為是 AGI 瓶頸的問題(例如,推理),但仍然無法自動化 95% 的知識工作。智慧比我們意識到的和之前定義的要多,這是可以承認的。 -持續學習瓶頸:未來 AI 的爆發性取決於解決持續學習 - 部署的代理,從經驗中學習,將知識合併回 "蜂巢思維"。距離這個還很遠,但我對我們能達到這一點持樂觀態度!