Avendo fatto RL presso OpenAI e Anthropic, ecco cosa posso dire su GRPO: