Efter att ha gjort RL på OpenAI och Anthropic, här är vad jag kan säga om GRPO: