GPT-4o đã thấp hơn trình độ của các chuyên gia y tế trong các tiêu chuẩn lý luận y tế, trong khi GPT-5 (có vẻ như Thinking medium) hiện đã vượt xa họ. (Các lưu ý thông thường về tiêu chuẩn áp dụng)
elvis
elvis20:58 12 thg 8
GPT-5 trong Lý luận Y tế Đa phương thức Trên MedXpertQA MM, GPT-5 cải thiện điểm số lý luận và hiểu biết lần lượt là +29,62% và +36,18% so với GPT-4o. Nó vượt qua các chuyên gia con người đã được cấp phép trước đó với tỷ lệ +24,23% trong lý luận và +29,40% trong hiểu biết.
98,4K