أنت في مقابلة مهندس تعلم آلي في Stripe. يسأل المحاور: "غالبا ما يعترض الناس على المعاملات التي أجروها فعليا. كيف ستبني نموذجا يتنبأ بهذه النزاعات المزيفة دون أي بيانات معنونة؟" أنت: "سأضع علامات على البطاقات ذات معدلات النزاع العالية." انتهت المقابلة. إليك ما فاتك: هناك تقنية تسمى التعلم النشط تتيح لك بناء نماذج خاضعة للإشراف بدون بيانات معنونة. إنه أرخص وأسرع من التعليق اليدوي. الفكرة بسيطة: الحصول على ملاحظات بشرية حول الأمثلة التي يواجه فيها النموذج صعوبات أكبر. إليك كيف تسير الأمور: ↳ ابدأ صغيرا: قم بوضع علامة يدوية على 1-2٪ من بياناتك. ابن نموذجك الأول على هذه المجموعة الصغيرة جدا. لن يكون جيدا، لكن هذه هي النقطة. ↳ توليد التوقعات: تشغيل النموذج على بيانات غير معنونة وجمع درجات الثقة. النماذج الاحتمالية تعمل جيدا هنا—انظر إلى الفجوة بين أعلى فئتين متوقعتين. ↳ تصنيف استراتيجي: ترتيب التوقعات بناء على الثقة. اجعل البشر يصنفون فقط الأمثلة على أقل الثقة. لا فائدة من تسمية ما يعرفه النموذج بالفعل. ↳ كرر وتحسين: أعد تغذية البيانات الموسومة إلى النموذج. تدرب مرة أخرى. النموذج يصبح أكثر ذكاء فيما لا يعرفه. توقف عندما يتوافق الأداء مع متطلباتك. ...