Saya pikir Sutton benar tentang segalanya pada dasarnya Peniruan pada hewan bukanlah tiruan. Ini adalah tujuan untuk ditiru, dan *tindakan motorik* dipelajari tanpa data apa pun. Jalak tidak dapat meniru tindakan motorik, ia tidak melihatnya. Ini adalah tujuan untuk ditiru
Sangat sulit untuk membuat orang memahami hal ini Dan btw jangan katakan LLM menggunakan rl Mereka tidak menggunakan RL seumur hidup mereka Itu sedang dalam perjalanan ke sana, dan melangkah lebih jauh hanya membuktikan pendapatnya lebih benar
LLM buruk omong-omong, dalam hal pelajaran pahit, karena pada dasarnya mereka adalah kebalikan dari pengganda komputasi. Saya mencoba membantu kalian mengerti.
@bftnad seperti, dia masih harus mencari tahu, belajar, mengeksplorasi bagaimana membuat perintah motorik yang sebenarnya
123,98K