Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-4o đã thấp hơn trình độ của các chuyên gia y tế trong các tiêu chuẩn lý luận y tế, trong khi GPT-5 (có vẻ như Thinking medium) hiện đã vượt xa họ. (Các lưu ý thông thường về tiêu chuẩn áp dụng)


20:58 12 thg 8
GPT-5 trong Lý luận Y tế Đa phương thức
Trên MedXpertQA MM, GPT-5 cải thiện điểm số lý luận và hiểu biết lần lượt là +29,62% và +36,18% so với GPT-4o.
Nó vượt qua các chuyên gia con người đã được cấp phép trước đó với tỷ lệ +24,23% trong lý luận và +29,40% trong hiểu biết.

98,4K
Hàng đầu
Thứ hạng
Yêu thích