Parallel-R1 Richtung paralleles Denken durch Verstärkungslernen