LiveCodeBench Pro 为编码评估设定了新的标准,并被 @NeurIPSConf 接受。 🧵 LiveCodeBench Pro 在严格的评审、真实的资源限制和对抗性的隐藏测试下评估端到端的算法推理,因此得分真正反映编码能力。