intră în perdant, hiperscalăm modelele RL de la zero