- La generalización es simplemente un algoritmo. - (Realimentación) Los transformadores pueden aprender cualquier algoritmo mediante GD. Pregunta principal: ¿Sobre qué datos de entrenamiento? Mi creencia: al entrenar transformers con RL en problemas correctamente seleccionados, surgirán habilidades de generalización que mejorarán significativamente.