.@RichardSSutton, padre del aprendizaje por refuerzo, no cree que los LLMs estén llenos de lecciones amargas. Mi interpretación del punto de vista de Richard: necesitamos una nueva arquitectura que permita el aprendizaje continuo (en el trabajo). Y si tenemos aprendizaje continuo, no necesitamos una fase de entrenamiento especial: el agente simplemente aprende sobre la marcha, como todos los humanos y, de hecho, como todos los animales. Este nuevo paradigma hará que nuestro enfoque actual con los LLMs quede obsoleto. Hice mi mejor esfuerzo para representar la opinión de que los LLMs funcionarán como la base sobre la cual puede ocurrir este aprendizaje experiencial. Algunas chispas volaron. 0:00:00 – ¿Son los LLMs un callejón sin salida? 0:13:51 – ¿Hacen los humanos aprendizaje por imitación? 0:23:57 – La Era de la Experiencia 0:34:25 – Las arquitecturas actuales generalizan mal fuera de distribución 0:42:17 – Sorpresas en el campo de la IA 0:47:28 – ¿Seguirá aplicándose la Lección Amarga después de la AGI? 0:54:35 – Sucesión a la IA
Busca el podcast de Dwarkesh en YouTube, Apple Podcasts, Spotify, etc. para verlo allí y suscribirte a futuros episodios.
893,33K