RLFactory: um framework RL plug-and-play para uso de ferramentas LLM • Chamadas de ferramentas assíncronas (mais rápidas, taxa de transferência de 6,8×) • Treinamento e ambiente desacoplados (baixo custo de configuração) • Design de recompensa flexível (regra, modelo, baseado em ferramenta) • Supera modelos maiores (Qwen3-4B > Qwen2.5-7B)