- A generalização é apenas um algoritmo. - (Feedback) Os Transformers podem aprender qualquer algoritmo através de GD. Pergunta principal: Com quais dados de treino? Minha crença: Ao treinar transformers com RL em problemas devidamente selecionados, as habilidades de generalização irão emergir e melhorar significativamente.