- OpenAIs modell løste alle 12 av 12 problemer i ICPC World Finals. - Googles Gemini 2.5 Deep Think løste 10/12. - Det beste menneskelige laget fikk 11/12. GPT-5 løste også 11/12, og en eksperimentell resonnementmodell løste det vanskeligste problemet. Konkurransedyktig programmering er ganske forskjellig fra å bygge store systemer eller skrive produksjonskode. Jeg vil gjerne se flere benchmarks som gjenspeiler virkelige programvareutviklingsoppgaver.