- Generalização é apenas um algoritmo. - (Realimentação) Transformers podem aprender qualquer algoritmo por meio de GD. Pergunta principal: Sobre quais dados de treinamento? Minha crença: Ao treinar transformers com RL em problemas corretamente selecionados, habilidades de generalização emergirão e melhorarão significativamente.