熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我們很高興地宣布,@NeurIPSConf——全球最大的AI會議——已接受我們在各個類別中的4篇論文。有些人甚至會稱之為「全棧卓越」😁
以下是我們的工作的一瞥,這些工作因其突破性而受到認可:
➡️ OML 1.0(主題追蹤):可擴展的LLM指紋識別——對於開放模型的舊有指紋識別嘗試的百倍改進,注入24,576個持久指紋,而之前的最大值約為100個指紋……而模型性能沒有下降。
➡️ LiveCodeBenchPro(數據與基準追蹤):我們定制的基準專注於編程能力,展示模型編碼性能的真實能力。在這個基準上,我們能夠創建10倍更小的模型,使用20%的數據,達到與競爭模型相當的結果。
➡️ MindGames Arena(競賽追蹤):被NeurIPS選中舉辦一場AI競賽,讓代理通過社交遊戲自我提升。AI改進的下一個範式來自自我優化,我們非常興奮能夠主辦這場首創的競賽,以創造自我提升的AI。
➡️ OML(工作坊與教程——Lock-LLMs):我們的工作建立了有關模型安全性的挑戰和解決方案:一種原語,讓建設者在白盒訪問下開發具有可驗證、加密強制控制的開放模型。
敬請期待本週的深入討論!
熱門
排行
收藏