我认为萨顿在基本上所有事情上都是对的 动物中的模仿并不是模仿。它是一个模仿的目标,而*运动动作*是在没有任何数据的情况下学习的。星鸲无法模仿运动动作,因为它看不到。模仿是一个目标。
让人们理解这一点是非常困难的 顺便说一下,不要说LLMs在使用强化学习 它们在其生命周期中并没有使用强化学习 这正在朝这个方向发展,进一步的进展只会证明他的观点更正确
顺便说一下,LLMs 是不好的,从痛苦的教训来看,因为它们基本上是计算倍增器的对立面。我试图帮助你们理解。
@bftnad 就是,他仍然需要弄清楚,学习,探索如何发出实际的电机指令
125.61K