我認為薩頓在基本上所有事情上都是對的 動物中的模仿並不是模仿。這是一個模仿的目標,而*運動行為*是在沒有任何數據的情況下學習的。星鴿無法模仿這些運動行為,它看不見。這是一個模仿的目標
讓人們理解這一點非常困難 順便說一下,不要說 LLMs 正在使用強化學習 它們在其生命週期中並沒有使用強化學習 這正在朝著那個方向發展,並且進一步的發展只會證明他的觀點更正確
順便說一下,LLMs 是糟糕的,因為它們在苦澀的教訓方面基本上是計算倍增器的對立面。我試著幫助你們理解。
@bftnad 像是,他仍然需要弄清楚、學習、探索如何發出實際的馬達指令
123.97K