10 minutos con GPT-5.2 demuestran que toda la narrativa del benchmarking es fundamentalmente errónea.