10 minutes avec GPT-5.2 prouvent que toute la narration sur le benchmarking est fondamentalement erronée.