10 minutter med GPT-5.2 beviser at hele benchmarking-narrativet er fundamentalt feil.