- Il modello di OpenAI ha risolto tutti i 12 problemi alle Finali Mondiali ICPC. - Il Gemini 2.5 Deep Think di Google ha risolto 10/12. - Il miglior team umano ha ottenuto 11/12. Anche GPT-5 ha risolto 11/12, e un modello sperimentale di ragionamento ha risolto il problema più difficile. La programmazione competitiva è molto diversa dalla costruzione di sistemi su larga scala o dalla scrittura di codice di produzione. Mi piacerebbe vedere più benchmark che riflettano compiti di ingegneria del software nel mondo reale.