حسنا، يبدو أن هذا الموضوع تم نشره بالفعل في ملاحظات الإصدار (تحققت)، لذا... (ملاحظة: اختبار النماذج جزء من عملي وهذا المنشور غير مدعوم من OpenAI بأي شكل): تمت دعوتي لاختبار GPT-5.1 Pro بشكل ألفا إلى جانب خبراء في الروبوتات والرياضيات والمناعة والطب والموسيقى والمزيد. كان تركيزي على أبحاث واستراتيجيات تجارية في علوم الحياة وبعض حالات الاستخدام الشخصية. بعد أن استخدمت GPT-5.1 Pro لبضعة أيام، أجده أشبه بخبير المجال البشري أكثر من GPT-5 Pro، مع كتابة أوضح، وحكم أفضل، وانحراف أقل، وتركيب أقوى، وردود أكثر وعيا عاطفيا. قمت بمواجهة GPT-5.1 Pro وجها لوجه مع GPT-5 Pro في مهام عمل مثل توليف الأدبيات العلمية، تخطيط إطلاق الأدوية، وتحليل وسائل التواصل الاجتماعي. جربته أيضا للتخطيط المالي الشخصي وحتى كتابة اليوميات. إنه كان: - أكثر صرامة وشمولية في البحث والتخطيط. - أقوى في التفكير. - أفضل في البقاء على المسار وتجنب الخطوط الممزوجة (وفي حالة واحدة على الأقل، الأخطاء المرتبطة بها). - أكثر وضوحا، وثقة، وأكثر تعاطفا في أسلوب التواصل. مع معرفتي بتركيز OpenAI على الأداء الواقعي (مثل GDPval) والتقارير التي تدعي توظيف خبراء في مجالات مثل المالية، أعتقد أن الخبرة البشرية في المجال هي بالضبط ما يسعون إليه، ومع GPT-5.1 Pro يقتربون أكثر. مع ذلك، ليست أفضل في كل شيء. لا يزال سيئا في إنشاء عروض تقديمية احترافية وجداول بيانات إكسل، وهو ضعف ملحوظ في نماذج OpenAI وأنا متأكد أنهم يعملون على إصلاحها. ورأيت أن أحد المختبرين على الأقل وجد أن النموذج تجنب بشكل محافظ معالجة المشكلات المفتوحة المعروفة في مجالات STEM، واختار بدلا من ذلك شرح سبب كونها مشاكل مفتوحة. بشكل عام، لو اضطررت لقياسه، سأقول إنه يفوق GPT-5 Pro بنسبة 10-15٪ من حيث الأشياء التي أستخدمها من أجلها. يبدو وكأنه خطوة نحو نماذج تفكر وتتواصل بشكل أكثر كزملاء حقيقيين، مع خبرة في المجال أفضل، وحدس وحكم أفضل، إلى جانب زيادة في التعاطف ومهارات التواصل. وهذا يبشر بالخير الذكاء الاصطناعي الذي يقوم بعمل أكثر تأثيرا في عام 2026.