Komm rein, Verlierer, wir skalieren RL-Modelle von Grund auf!