看到這一切匯聚在一起真是太酷了,@brendanh0gan 主導的工作令人難以置信,整體上這是一個極其詳細的配方,說明了在 OOD 任務中打造專業模型所需的條件,而前沿模型在這方面確實很掙扎。 論文/權重/數據/代碼在 brendan 的帖子中 :)
Brendan Hogan
Brendan Hogan8月13日 22:42
介紹 qqWen:我們完全開源的項目(代碼+權重+數據+詳細技術報告),用於全棧微調(預訓練+SFT+RL),一系列模型(1.5b、3b、7b、14b 和 32b),用於一種名為 Q 的小眾金融編程語言。 所有細節如下!
18.25K