GPT-4o était en dessous du niveau des professionnels de la santé sur les critères de raisonnement médical, tandis que GPT-5 (apparemment Thinking medium) les dépasse désormais largement. (Les habituelles mises en garde concernant les critères s'appliquent)
elvis
elvis12 août, 20:58
GPT-5 sur le Raisonnement Médical Multimodal Sur MedXpertQA MM, GPT-5 améliore les scores de raisonnement et de compréhension de +29,62 % et +36,18 % par rapport à GPT-4o. Il dépasse les experts humains pré-licenciés de +24,23 % en raisonnement et de +29,40 % en compréhension.
98,4K