- Generalizarea este doar un algoritm. - (Feedback) Transformerele pot învăța orice algoritm prin GD. Întrebarea principală: Despre ce date de antrenament? Credința mea: Când antrenezi transformerii cu RL pe probleme selectate corect, vor apărea și vor îmbunătăți semnificativ abilități de generalizare.