热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
介绍 NousCoder-14b,一个具有竞争力的奥林匹克编程模型。
我们最新的博客详细介绍了来自广泛实验和日志的完整发现,发布了完整的堆栈 - RL 环境、基准和在 Atropos 中构建的工具,所有这些都可以通过我们的开放训练堆栈完全复现。
NousCoder-14b 由驻校研究员 @JoeLi5050 在 4 天内使用 48 个 B200s 对 Qwen3-14B 进行了后训练,使用我们的 Atropos 框架和 @modal 的自动缩放器。它的 Pass@1 准确率为 67.87%,比 Qwen 的基线准确率提高了 7.08%。

热门
排行
收藏
