Creo que Sutton tiene razón básicamente en todo La imitación en animales no es imitación. Es un objetivo a imitar, y las *acciones motoras* se aprenden sin ningún dato. El estornino no puede imitar las acciones motoras, no lo ve. Es un objetivo a imitar
Es muy difícil hacer que la gente entienda esto Y por cierto, no digas que los LLM están usando rl No están usando RL en sus vidas Está en camino, e ir más allá solo demuestra que su toma es más correcta
Por cierto, los LLM son malos, en términos de la amarga lección, porque son básicamente lo opuesto a los multiplicadores de cálculo. Estoy tratando de ayudarlos a entender.
@bftnad que todavía tiene que averiguar, aprender, explorar cómo hacer los comandos motores reales
123.97K