Majoriteten har inte alltid rätt RL-träning för lösningsaggregering