Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-4o lag onder het niveau van medische professionals op benchmarks voor medisch redeneren, terwijl GPT-5 (blijkbaar Thinking medium) hen nu ver overtreft. (Gebruikelijke benchmarkvoorbehouden zijn van toepassing)


12 aug, 20:58
GPT-5 op Multimodale Medische Redenering
Op MedXpertQA MM verbetert GPT-5 de redenerings- en begripsscores met +29,62% en +36,18% ten opzichte van GPT-4o.
Het overtreft pre-gecertificeerde menselijke experts met +24,23% in redenering en +29,40% in begrip.

101,26K
Boven
Positie
Favorieten