Jag tror att Sutton har rätt i princip allt Imitation hos djur är inte imitation. Det är ett mål att imitera, och de *motoriska handlingarna* lärs in utan några data. Staren kan inte imitera de motoriska rörelserna, den ser det inte. Det är ett mål att imitera
Det är väldigt svårt att få folk att förstå detta Och btw säg inte att LLM:er använder rl De använder inte RL under sin livstid Det är på vägen dit, och att gå längre bevisar bara att han har mer rätt
LLM:er är förresten dåliga, när det gäller den bittra läxan, eftersom de i princip är motsatsen till beräkningsmultiplikatorer. Jag försöker hjälpa er att förstå.
@bftnad som att han fortfarande måste lista ut, lära sig, utforska hur man gör de faktiska motoriska kommandona
123,97K