GPT-4o был ниже уровня медицинских специалистов по стандартам медицинского рассуждения, тогда как GPT-5 (по всей видимости, Thinking medium) теперь значительно их превосходит. (Обычные оговорки по стандартам применимы)
elvis
elvis12 авг., 20:58
GPT-5 в многомодальном медицинском рассуждении На MedXpertQA MM GPT-5 улучшает показатели рассуждения и понимания на +29,62% и +36,18% по сравнению с GPT-4o. Он превосходит предлицензированных человеческих экспертов на +24,23% в рассуждении и +29,40% в понимании.
101,26K