i motsetning til fortrening, er RL ettertrening en veldig aktiv involvert prosess. Du må overvåke utrullinger, justere belønninger, legge til/fjerne/endre oppgaver hele tiden hvis du vil ha gode resultater.