LiveCodeBench Pro établit une nouvelle norme pour l'évaluation du codage et est accepté à @NeurIPSConf 🧵 LiveCodeBench Pro évalue le raisonnement algorithmique de bout en bout sous des juges stricts, des limites de ressources réelles et des tests cachés adversariaux, de sorte que les scores communiquent véritablement les capacités de codage.