- Tổng quát chỉ là một thuật toán. - (Phản hồi) Transformers có thể học bất kỳ thuật toán nào thông qua GD. Câu hỏi chính: Trên dữ liệu huấn luyện nào? Niềm tin của tôi: Khi huấn luyện transformers với RL trên những vấn đề được chọn lựa đúng cách, khả năng tổng quát sẽ xuất hiện và cải thiện đáng kể.