GPT-4o låg under nivån för medicinsk personal på riktmärken för medicinskt resonemang, GPT-5 (tydligen Thinking medium) överträffar dem nu med råge. (Vanliga varningar för riktmärken gäller)
elvis
elvis12 aug. 2025
GPT-5 om multimodalt medicinskt resonemang På MedXpertQA MM förbättrar GPT-5 poängen för resonemang och förståelse med +29,62 % och +36,18 % jämfört med GPT-4o. Den överträffar förlicensierade mänskliga experter med +24,23 % i resonemang och +29,40 % i förståelse.
101,39K