出色的工作,展示了将提示合成作为推理的新扩展轴。 优质的训练数据稀缺。 这项工作展示了一个框架,可能使构建高质量的以推理为重点的 LLM 训练问题成为可能。 技术细节如下: