RLFactory:一个即插即用的RL框架,用于LLM工具使用 • 异步工具调用(更快,6.8×吞吐量) • 解耦的训练与环境(低设置成本) • 灵活的奖励设计(规则、模型、工具基础) • 超越更大的模型(Qwen3-4B > Qwen2.5-7B)