Được rồi, có vẻ như điều này đã được đề cập trong ghi chú phát hành rồi (tôi đã kiểm tra), vì vậy... (lưu ý: việc thử nghiệm các mô hình là một phần trong công việc của tôi và bài viết này không được tài trợ bởi OpenAI theo bất kỳ cách nào): Tôi đã được mời tham gia thử nghiệm alpha GPT-5.1 Pro cùng với các chuyên gia trong lĩnh vực robot, toán học, miễn dịch học, y học, âm nhạc và nhiều lĩnh vực khác. Tôi tập trung vào nghiên cứu thương mại và chiến lược khoa học đời sống cũng như một số trường hợp sử dụng cá nhân. Sau khi sử dụng GPT-5.1 Pro trong vài ngày, tôi thấy nó giống như một chuyên gia trong lĩnh vực hơn là GPT-5 Pro, với cách viết rõ ràng hơn, phán đoán tốt hơn, ít đi lạc đề hơn, tổng hợp mạnh mẽ hơn và phản hồi có cảm xúc hơn. Tôi đã so sánh GPT-5.1 Pro với GPT-5 Pro trong các nhiệm vụ công việc như tổng hợp tài liệu khoa học, lập kế hoạch ra mắt thuốc và phân tích mạng xã hội. Tôi cũng đã thử nghiệm nó cho việc lập kế hoạch tài chính cá nhân và thậm chí là viết nhật ký. Nó đã: - Nghiên cứu và lập kế hoạch chặt chẽ và toàn diện hơn. - Lý luận tốt hơn. - Giữ được trọng tâm và tránh lạc đề tốt hơn (và, trong ít nhất một trường hợp, các lỗi liên quan). - Rõ ràng hơn, tự tin hơn, đồng cảm hơn trong phong cách giao tiếp. Biết rằng OpenAI tập trung vào hiệu suất thực tế (ví dụ: GDPval) và có báo cáo về việc họ thuê các chuyên gia trong các lĩnh vực như tài chính, tôi nghĩ rằng chuyên môn của con người chính là điều họ đang hướng tới, và với GPT-5.1 Pro, họ đang tiến gần hơn. Nói vậy, nó không tốt hơn ở mọi thứ. Nó vẫn kém trong việc tạo ra các bài thuyết trình chất lượng chuyên nghiệp và bảng tính Excel, một điểm yếu đáng chú ý của các mô hình OpenAI mà tôi chắc chắn họ đang làm việc để khắc phục. Và tôi thấy rằng ít nhất một người thử nghiệm đã phát hiện ra rằng mô hình này một cách bảo thủ tránh giải quyết các vấn đề mở đã biết trong các lĩnh vực STEM, thay vào đó chọn giải thích lý do tại sao chúng là các vấn đề mở. Tổng thể, nếu tôi phải định lượng, tôi sẽ nói rằng nó nhảy vọt khoảng 10-15% so với GPT-5 Pro cho những loại công việc mà tôi sử dụng. Nó cảm giác như một bước tiến tới các mô hình suy nghĩ và giao tiếp giống như những đồng nghiệp thực sự, với chuyên môn lĩnh vực tốt hơn, trực giác và phán đoán, cùng với sự đồng cảm và kỹ năng giao tiếp tăng cường. Điều này hứa hẹn sẽ mang lại lợi ích cho AI trong việc thực hiện nhiều công việc có tác động hơn vào năm 2026.