المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 DeepSeek فعلت شيئا غريبا للتو.
بنوا نموذجا رياضيا لا يكتفي بحل المشكلات، بل يتحقق من براهاته الخاصة، وينتقد نفسه، ويصلح المنطق، ويحاول مرة أخرى حتى لا يجد أي عيب واحد.
الجزء الأخير هو الاختراق في نموذج يمكنه التحقق من منطقه قبل أن تتحقق منه.
والنتائج سخيفة:
• الأداء على مستوى الذهب في IMO 2025
• أداء على مستوى ذهبي في CMO 2024
• 118/120 في بوتنام 2024 شبه مثالي، متجاوزا كل النقاط البشرية
• يتفوق على GPT-5 Thinking وGemini 2.5 Pro في أصعب الفئات
ما يجعل DeepSeek Math V2 مجنونة ليس الدقة، بل في البنية المعمارية وراءها.
لم يطاردوا نماذج أكبر أو سلسلة أفكار طويلة.
لقد بنوا نظاما بيئيا:
✓ محقق مخصص يبحث عن الفجوات المنطقية
✓ متحقق ميتا يتحقق مما إذا كان المتحقق يعاني من هلوسة
✓ مولد إثبات يتعلم الخوف من التفكير السيء
✓ وحلقة تدريب حيث يستمر النموذج في توليد براهين أصعب تجبر المتحقق على التطور
الدورة قاسية:
إنشاء → التحقق → التحقق الميتا → إصلاح → التكرار.
المشكلة الأساسية التي حلوها: دقة الإجابة النهائية لا تعني شيئا في إثبات النظرية. يمكنك الحصول على الرقم الصحيح باستخدام منطق سيء. لذا دربوا محققا ليحكم على الإثبات نفسه، وليس الإجابة النهائية.
...

الأفضل
المُتصدِّرة
التطبيقات المفضلة

