- Узагальнення — це просто алгоритм. - (Зворотний зв'язок) Трансформери можуть вивчати будь-який алгоритм за допомогою GD. Головне питання: Про які навчальні дані? Моя віра: коли тренуєш трансформаторів з RL на правильно підібраних задачах, здібності генералізації проявляються і значно покращуються.