بعد عدة أيام أخرى من الاستخدام المكثف ل GPT-5 عبر المؤشر وعبر طراز GPT-5 Pro في تطبيق الويب ، أقف إلى جانب كل ما قلته عن كونه نموذجا أكثر ذكاء وأفضل في الترميز من Opus 4.1 ما زلت أحب Opus وأجد بيئة العمل في Claude Code أجمل من نواح كثيرة ، ولكن إذا كنت تحاول القيام بأشياء صعبة حقا تتطلب تفكيرا ذكيا حقا في المبادئ الأولى وقطع علوم الكمبيوتر ، فإن GPT-5 هو المستوى التالي. لكنني أظن أن هذا لا يظهر إلا عندما يتم ضبط وضع جهد التفكير على متوسط على الأقل ، ويتجلى حقا في إعداد الجهد العالي. ومن الأمثلة الجيدة على المشكلة إعداد "خطوط حمراء" للمستندات لوثيقتين قانونيتين طويلتين ومعقدتين. ليست إصدارات مختلفة من نفس المستند، ولكن مستندان مختلفان يأتيان من قالب عام مشترك. هذه مشكلة صعبة للغاية للقيام بعمل جيد عليها ، وتتطلب العديد من الحيل والاستدلال الذكي لإعطاء أداء لائق وجودة إخراج (أنا أتحدث عن استخدام تقنيات البرمجة التقليدية هنا ، وليس استخدام LLMs للقيام بهذه المقارنة). يمكن ل GPT-5 مع عامل المؤشر ببساطة التوصل إلى أفكار أكثر وأفضل وذكية (ولكنها عملية) بشكل أسرع ، وتنفيذها بشكل صحيح وبدون الكثير من الإمساك باليد ، مقارنة ب Opus4.1. يعتمد ذلك على ما تعمل عليه. ما زلت أعتقد أنني أفضل كود الواجهة الأمامية في NextJS by Opus ، على سبيل المثال. ولكن يجب عليك التحقق تماما من مشاكلك الفعلية وعدم الوثوق بكل الأشخاص الذين يقولون إن النموذج سيء وأنه دليل على أننا اصطدمنا بالحائط. إما أنهم يستخدمون الإصدار المجاني السيئ دون تفكير ، أو ليس لديهم أدنى فكرة عن كيفية المطالبة بفعالية ، أو أنهم يتركون مشاعرهم تجاه OpenAI و Altman تلون وجهات نظرهم.
‏‎35.61‏K