După ce am făcut RL la OpenAI și Anthropic, iată ce pot spune despre GRPO: