GPT-4o byl v benchmarkech lékařského uvažování pod úrovní lékařských profesionálů GPT-5 (zřejmě Thinking medium) je nyní daleko překračuje. (Platí obvyklá upozornění týkající se srovnávacích testů.)
elvis
elvis12. 8. 20:58
GPT-5 o multimodálním lékařském uvažování Na MedXpertQA MM zlepšuje GPT-5 skóre uvažování a porozumění o +29,62 % a +36,18 % oproti GPT-4o. Překonává předem licencované lidské odborníky o +24.23 % v uvažování a +29.40 % v porozumění.
98,4K