- OpenAIのモデルは、ICPCワールドファイナルで12の問題のうち12個をすべて解決しました。 - Google の Gemini 2.5 Deep Think は 10/12 を解決しました。 - トップヒューマンチームは11/12を獲得しました。 GPT-5 も 11/12 を解決し、実験的推論モデルが最も難しい問題を解決しました。 競争力のあるプログラミングは、大規模なシステムの構築や本番コードの作成とはまったく異なります。実際のソフトウェアエンジニアリングタスクを反映するベンチマークをもっと見たいです。