10 minut s GPT-5.2 dokazuje, že celý narativ benchmarkingu je zásadně chybný.