- Le modèle d'OpenAI a résolu tous les 12 problèmes lors des finales mondiales de l'ICPC. - Le Gemini 2.5 Deep Think de Google a résolu 10/12. - L'équipe humaine la mieux classée a obtenu 11/12. GPT-5 a également résolu 11/12, et un modèle de raisonnement expérimental a résolu le problème le plus difficile. La programmation compétitive est assez différente de la construction de systèmes à grande échelle ou de l'écriture de code de production. J'aimerais voir plus de benchmarks qui reflètent les tâches d'ingénierie logicielle du monde réel.