「任何可以學習的東西都可以在強化學習環境中學習。」 那麼我們會有 Claude Code 的時刻來處理所有事情嗎? 我們是否已經有新的模型在代碼之外,利用強化學習環境的成果進行訓練? 感覺在 25 年時,我們有很多公司在做這些。
Jackson Kernion
Jackson Kernion12月27日 08:15
我正在試著弄清楚接下來該關心什麼。我在四年多前加入了Anthropic,受到建立AGI夢想的驅動。我從研究心靈哲學中深信,我們正接近足夠的規模,任何可以學習的東西都可以在強化學習環境中學習。
Anthropic 目前是最看漲的嗎?RL + Scale = AGI?
@jackclarkSF 我現在可以退休到意大利的農場了嗎,讓Claude來照顧我的農場
572