介绍 NousCoder-14b,一个具有竞争力的奥林匹克编程模型。 我们最新的博客详细介绍了来自广泛实验和日志的完整发现,发布了完整的堆栈 - RL 环境、基准和在 Atropos 中构建的工具,所有这些都可以通过我们的开放训练堆栈完全复现。 NousCoder-14b 由驻校研究员 @JoeLi5050 在 4 天内使用 48 个 B200s 对 Qwen3-14B 进行了后训练,使用我们的 Atropos 框架和 @modal 的自动缩放器。它的 Pass@1 准确率为 67.87%,比 Qwen 的基线准确率提高了 7.08%。