في Box ، نقضي الكثير من الوقت في اختبار Box الذكاء الاصطناعي مع نماذج جديدة على البيانات غير المهيكلة لمعرفة ما يؤديونه جيدا في المجالات الحقيقية للعمل المعرفي. كما رأينا من المعايير ، يوفر GPT-5 قفزة ذات مغزى في القدرة على GPT-4.1 في التفكير والرياضيات والمنطق والترميز ومجالات العمل الأخرى. فيما يلي بعض الأمثلة على مكان ظهور هذه التحسينات في العالم الحقيقي: * GPT 5 يضع المعلومات في سياقها بشكل أفضل. عند القيام باستخراج البيانات مثل المبلغ النهائي بالدولار الأمريكي في فاتورة بدون ملصقات عملة ولكن بعنوان في لندن ، يستجيب GPT 5 بشكل صحيح بالحاجة إلى معدل تحويل من الدولار الأمريكي إلى الجنيه الإسترليني. وبالمقارنة ، رأى GPT 4.1 الفاتورة النهائية وأعادها ، بافتراض العملة (بشكل غير صحيح). * يوفر GPT-5 تحليلا أفضل متعدد الوسائط. بالنسبة للإيداع السنوي لشركة عامة ، يطلب من GPT-5 عزل خلية في جدول عن صورة توضح التغييرات في مكونات حقوق الملكية للشركة. يوضح الجزء العلوي من الجدول أن جميع مبالغ الأسهم بالآلاف ، ويذكر GPT-5 بوضوح هذا التحويل ، في حين أن GPT-4.1 لا يفعل ذلك ، حيث يتم الخلط بين الجدول أن الجدول يقول المخزون والأسطورة تقول الأسهم. * يعمل GPT-5 بشكل أفضل مع مستويات عالية من التعقيد الفوري والبيانات. عند القيام باستخراج البيانات في السيرة الذاتية لجميع تواريخ بدء العمل وأسماء المناصب الوظيفية وأسماء أصحاب العمل ، كان GPT-5 قادرا على سحب كل جزء من البيانات بينما يبدو أن GPT-4.1 غارق ولم يستخرج نفس الحقول نظرا لحجم موجه المستند وتعقيده. * GPT-5 أكثر وضوحا ووضوحا في إجاباته. في اتفاقية الاستعانة بمصادر خارجية مع 6 خدمات مختلفة تمت مناقشتها صراحة ، عندما سئل عن "الخدمات الخمس المحددة في العقد" ، سيعيد GPT-5 أول 5 خدمات ويسأل عما إذا كان من المتعمد عدم سؤال السادسة. بالمقارنة ، أعاد GPT-4.1 ببساطة أول 5 دون أي محاذير أخرى ، مما قد يؤدي إلى ارتباك المصب للمستخدم. * GPT-5 أفضل في تفسير البيانات في المجالات المعقدة. بالنسبة لمخطط قياس التدفق الخلوي ، الذي يستخدم عادة في علم المناعة ، حدد GPT-5 بشكل صحيح نسبة عالية من الخلايا الميتة وأعطى أسبابا جذرية معقولة قد تؤدي إلى الموقف بينما أعطى GPT-4.1 الحد الأدنى من المنطق ، ويحتاج إلى مزيد من التأكيد للحصول على أي تخمينات من البيانات الأولية. * GPT-5 أكثر قدرة على تحديد التناقضات في الكود. عندما يطلب منك تحديد المشكلات في ملف كود python معين ، بينما يمكن لكل من GPT-5 و 4.1 تحديد الأخطاء الحقيقية التي تؤدي إلى حدوث خلل ، كان GPT-5 فقط قادرا على استنتاج مشكلات أكثر دقة ، مثل طباعة المتغير غير الصحيح عندما لا يكون ذلك منطقيا في سياق البرنامج. هذه التحسينات في الرياضيات والتفكير والمنطق وجودة الردود في نوافذ السياق الأطول مفيدة بشكل لا يصدق للمستخدمين النهائيين في العمل اليومي ، ولكنها ستظهر بشكل أكبر مع وكلاء الذكاء الاصطناعي الذين يعملون لفترة أطول ، خاصة عندما لا يكون هناك إنسان في الحلقة للتحقق من المعلومات في كل خطوة. إنه لأمر رائع أن نرى هذه التحسينات تستمر في أحدث مجموعة من نماذج الذكاء الاصطناعي لأن هذا سيؤدي إلى إمكانية استخدام عوامل الذكاء الاصطناعي في مجالات عمل أكثر أهمية بشكل تدريجي.
‏‎77.97‏K