Bra arbete som visar snabb syntes som en ny skalningsaxel för resonemang. Bra träningsdata är knapphändiga. Detta arbete visar ett ramverk som kan göra det möjligt att konstruera högkvalitativa träningsproblem för resonemangsfokuserade LLM:er. Tekniska detaljer nedan: