- Generalizacja to po prostu algorytm. - (Informacja zwrotna) Transformery mogą nauczyć się dowolnego algorytmu poprzez GD. Główne pytanie: Na jakich danych treningowych? Moje przekonanie: Kiedy trenujemy transformery z użyciem RL na odpowiednio dobranych problemach, zdolności do generalizacji będą się pojawiać i znacznie poprawiać.