GPT 5.2s arc agi 2 結果を再現するコードはありますか?そのバニラにはあまり響かなかった気がします。
真剣なシステムプロンプトでも、36〜40%くらい取れるかもしれません。だから、自分が何を見落としているのか気になっています。
@tszzl @SebastienBubeck @sama @gdb
101