Các tiêu chuẩn AI giống như các bài kiểm tra chuẩn mà chúng ta đã lớn lên với chúng ở trường. OpenAI dường như đã dạy cho bài kiểm tra với 5.2 và tạo ra một mô hình tốt hơn trong việc làm bài kiểm tra hơn là làm những việc hữu ích một mình. Tôi hy vọng họ sẽ điều chỉnh lại. Hiện tại, tôi đang sử dụng Gemini và Grok