Nachdem ich RL bei OpenAI und Anthropic gemacht habe, kann ich Folgendes über GRPO sagen: