GPT-4o は、医療推論ベンチマークでは医療専門家のレベルを下回っていましたが、GPT-5 (明らかに思考媒体) は現在、彼らをはるかに上回っています。(通常のベンチマークの注意事項が適用されます)
elvis
elvis8月12日 20:58
マルチモーダル医学的推論に関するGPT-5 MedXpertQA MMでは、GPT-5はGPT-4oよりも推論と理解のスコアを+29.62%、+36.18%向上させています。 推論で +24.23%、理解で +29.40% の事前ライセンスを取得した人間の専門家を上回っています。
100.22K