Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-4o był poniżej poziomu profesjonalistów medycznych w benchmarkach rozumowania medycznego, podczas gdy GPT-5 (najwyraźniej Thinking medium) teraz znacznie ich przewyższa. (Zwykłe zastrzeżenia dotyczące benchmarków mają zastosowanie)


12 sie, 20:58
GPT-5 w multimodalnym rozumieniu medycznym
Na MedXpertQA MM, GPT-5 poprawia wyniki w zakresie rozumowania i zrozumienia o +29,62% i +36,18% w porównaniu do GPT-4o.
Przewyższa licencjonowanych ekspertów ludzkich o +24,23% w rozumowaniu i +29,40% w zrozumieniu.

100,86K
Najlepsze
Ranking
Ulubione