出色的工作,展示了作為推理新擴展軸的即時合成。 優質的訓練數據稀缺。 這項工作展示了一個框架,可能使得為以推理為重點的LLM構建高質量訓練問題成為可能。 技術細節如下: