A ciência da otimização de RL é provavelmente o último problema científico aberto da humanidade