Đa số không phải lúc nào cũng đúng Đào tạo RL cho việc tổng hợp giải pháp