حزمة نماذجي بعد أكثر 8 أيام جنونا في الذكاء الاصطناعي: العمل 4.5: معظم مهام الكود اليومية التي أعرف كيف أريد أن يفعل النموذج ما أريد. سريع، نظيف، موثوق، لكنه غالبا ما يبدأ بكتابة الكود قبل أن يلتقط كل السياق الذي يحتاجه (يقيس مرة، يقطع مرتين). Codex-Max: مهام برمجية أكبر وأصعب (خاصة الخلفية الخلفية) حيث لا أريد أن أحدد أفضل طريقة لفعل شيء ما. يستكشف قبل أن يتحرك، لذا غالبا ما يكون أكثر موثوقية (يقيس مرتين، يقطع مرة واحدة). مثبت GPT-5.1: تخطيط عميق، بحث، عمل عالي المخاطر (مرة أخرى، خاصة الخلفية) حيث لا يمكنني أن أكون مخطئا. إذا لم أرغب في التعامل مع تصحيح الأخطاء الدقيقة، ألجأ إلى GPT-5.1 Pro. فقط تنجح في المحاولة الأولى (لكنها بطيئة جدا وعالقة في واجهة ChatGPT). Gemini 3 Pro: الكتابة، التفكير العام، وتصميم واجهة المستخدم. أفضل في جعل واجهات الواجهة الأمامية تبدو مصقولة بدلا من أن تكون عشوائية الذكاء الاصطناعي، لكنها أقل موثوقية من غيرها في مهام الكود العامة.