ついにGPT-5.2 X-Highを使ってARC-AGI-2でシステムを動かす時間ができました! 以前と同じPoetiqハーネスを用いたところ、GPT-5.2 X-Highを用いてPUBLIC-EVALデータセット全体で問題あたり8ドル未満で75%の成果が得られました。これは前回のSOTAを約15ポイント上回っています。