تفوقت شركة ناشئة مكونة من 6 أشخاص بقيمة 500 ألف دولار على Microsoft! يعد MLE-Bench من OpenAI معيارا يختبر الوكلاء على مهام هندسة التعلم الآلي. سجلت NEO @withneo ، أول وكيل MLE مستقل ، 34.2٪ مقابل 22.4٪ لشركة Microsoft على المعيار. هذا ضخم!
‏‎3.62‏K