- Generalisatie is gewoon een algoritme. - (Feedback) Transformers kunnen elk algoritme leren via GD. Hoofdvraag: Op welke trainingsdata? Mijn overtuiging: Wanneer transformers met RL worden getraind op goed geselecteerde problemen, zullen generalisatievaardigheden ontstaan en aanzienlijk verbeteren.