- Generalisering er bare en algoritme. - (Feedback) Transformatorer kan lære hvilken som helst algoritme gjennom GD. Hovedspørsmål: På hvilke treningsdata? Min tro: Når man trener transformatorer med RL på riktig utvalgte problemer, vil generaliseringsevner dukke opp og forbedres betydelig.