- Обобщение — это всего лишь алгоритм. - (Обратная связь) Трансформеры могут изучать любой алгоритм с помощью GD. Основной вопрос: На каких обучающих данных? Мое мнение: При обучении трансформеров с помощью RL на правильно подобранных задачах способности к обобщению будут проявляться и значительно улучшаться.