Después de haber hecho RL en OpenAI y Anthropic, esto es lo que puedo decir sobre GRPO: