我们很高兴地宣布,@NeurIPSConf——全球最大的AI会议——接受了我们在各个类别中提交的4篇论文。有些人甚至会称之为“全栈卓越”😁 以下是我们因其突破性成果而获得认可的工作的预览: ➡️ OML 1.0(主轨道):可扩展的LLM指纹识别——在开放模型的传统指纹识别尝试中实现了百倍的改进,注入了24,576个持久指纹,而之前的最大值约为100个指纹……而模型性能没有任何下降。 ➡️ LiveCodeBenchPro(数据与基准轨道):我们定制的基准测试,专注于编程能力,展示了模型编码性能的真实能力。在这个基准测试中,我们能够创建10倍更小的模型,使用20%的数据,取得与竞争模型相当的结果。 ➡️ MindGames Arena(竞赛轨道):被NeurIPS选中举办一场AI竞赛,让代理通过社交游戏自我提升。AI改进的下一个范式来自自我优化,我们非常兴奋能够主办这一首创的竞赛,以创造自我提升的AI。 ➡️ OML(研讨会与教程——Lock-LLMs):我们的工作确立了模型安全性相关的挑战和解决方案:一种原语,允许构建者在白盒访问下开发具有可验证、加密强制控制的开放模型。 请继续关注本周的深入讨论!