10 minute cu GPT-5.2 dovedesc că întreaga narațiune a benchmarking-ului este fundamental greșită.