AIベンチマークは、私たちが学校で育った標準化テストのようなものです。OpenAIは5.2でテストを教え、テストの方が役立つよりもテストに向いているモデルを作りました。彼らが正しい方向性を取ることを願っています。今のところ、GeminiとGrokを使っています