Na RL te hebben gedaan bij OpenAI en Anthropic, hier is wat ik kan zeggen over GRPO: