O GPT-4o estava abaixo do nível dos profissionais de saúde em benchmarks de raciocínio médico; o GPT-5 (aparentemente Thinking medium) agora os supera amplamente. (As habituais ressalvas sobre benchmarks se aplicam)
elvis
elvis12/08, 20:58
GPT-5 em Raciocínio Médico Multimodal No MedXpertQA MM, o GPT-5 melhora as pontuações de raciocínio e compreensão em +29,62% e +36,18% em relação ao GPT-4o. Ele supera especialistas humanos pré-licenciados em +24,23% em raciocínio e +29,40% em compreensão.
101,27K