GPT-4o був нижчим за рівень медичних працівників за тестами медичних міркувань GPT-5 (мабуть, Thinking medium) зараз значно їх перевершує. (Застосовуються звичайні застереження щодо контрольних показників)
elvis
elvis12 серп., 20:58
GPT-5 про мультимодальні медичні міркування На MedXpertQA MM GPT-5 покращує оцінки міркувань та розуміння на +29,62% та +36,18% порівняно з GPT-4o. Він перевершує експертів-людей, які мають доліцензовану ліцензію, на +24,23% у міркуваннях та +29,40% у розумінні.
98,39K