- La generalización es solo un algoritmo. - (Retroalimentación) Los Transformers pueden aprender cualquier algoritmo a través de GD. Pregunta principal: ¿Con qué datos de entrenamiento? Mi creencia: Al entrenar transformers con RL en problemas seleccionados adecuadamente, las habilidades de generalización emergerán y mejorarán significativamente.