Tendo feito RL na OpenAI e Anthropic, aqui está o que posso dizer sobre GRPO: