Nói rằng GPT-5 nói dối ít hơn o3 không thực sự có ý nghĩa nhiều khi xem xét o3 là một kẻ nói dối bệnh hoạn tuyệt đối! Ngay cả khi giảm 80%, nó vẫn sẽ dẫn đến nhiều lời nói dối mỗi ngày dưới mức sử dụng cao.
Nhắc nhở:
Jeffrey Emanuel
Jeffrey Emanuel25 thg 4, 2025
Examples of o3 lying through its teeth in a really concerning way. It’s constantly making absolutely outrageous claims about how much faster the code is after its revisions (it doesn’t even know if it will *run*), whether it’s functioning properly, that it tested things, etc.
1,91K