entra, perdedor, estamos a escalar modelos RL do zero