我們很高興地宣布,@NeurIPSConf——全球最大的AI會議——已接受我們在各個類別中的4篇論文。有些人甚至會稱之為「全棧卓越」😁 以下是我們的工作的一瞥,這些工作因其突破性而受到認可: ➡️ OML 1.0(主題追蹤):可擴展的LLM指紋識別——對於開放模型的舊有指紋識別嘗試的百倍改進,注入24,576個持久指紋,而之前的最大值約為100個指紋……而模型性能沒有下降。 ➡️ LiveCodeBenchPro(數據與基準追蹤):我們定制的基準專注於編程能力,展示模型編碼性能的真實能力。在這個基準上,我們能夠創建10倍更小的模型,使用20%的數據,達到與競爭模型相當的結果。 ➡️ MindGames Arena(競賽追蹤):被NeurIPS選中舉辦一場AI競賽,讓代理通過社交遊戲自我提升。AI改進的下一個範式來自自我優化,我們非常興奮能夠主辦這場首創的競賽,以創造自我提升的AI。 ➡️ OML(工作坊與教程——Lock-LLMs):我們的工作建立了有關模型安全性的挑戰和解決方案:一種原語,讓建設者在白盒訪問下開發具有可驗證、加密強制控制的開放模型。 敬請期待本週的深入討論!