Большинство не всегда правы Обучение RL для агрегации решений