10 хвилин з GPT-5.2 доводять, що вся наратива бенчмаркінгу є фундаментально хибною.