Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-4o byl v benchmarkech lékařského uvažování pod úrovní lékařských profesionálů GPT-5 (zřejmě Thinking medium) je nyní daleko překračuje. (Platí obvyklá upozornění týkající se srovnávacích testů.)


12. 8. 20:58
GPT-5 o multimodálním lékařském uvažování
Na MedXpertQA MM zlepšuje GPT-5 skóre uvažování a porozumění o +29,62 % a +36,18 % oproti GPT-4o.
Překonává předem licencované lidské odborníky o +24.23 % v uvažování a +29.40 % v porozumění.

98,4K
Top
Hodnocení
Oblíbené