Setelah melakukan RL di OpenAI dan Anthropic, inilah yang dapat saya katakan tentang GRPO: