基本的にすべてについてサットンは正しいと思います 動物の模倣は模倣ではありません。真似することが目標であり、*運動動作*はデータなしで学習されます。ムクドリは運動動作を模倣することはできず、それを見ません。真似することが目標です
これを人々に理解してもらうのは非常に難しいです ところで、LLMがrlを使用しているとは言っていません 彼らは生涯にわたってRLを使用していません それはそこに向かっているところであり、さらに進むことは彼の見解がより正しいことを証明するだけです
ちなみに、LLM は基本的に計算乗数の反対であるため、苦い教訓という点では悪いです。皆さんに理解してもらいたいと思っています。
@bftnad、彼はまだ実際の運動コマンドの作り方を理解し、学び、探求する必要があります
123.97K