عندما يكون النموذج هو المنتج ، فإن كل تجربة المستخدم هي RLHF. يصبح كل تعديل وتصحيح ونقرة إشارة تدريب. حرفة مصمم المنتج الجديدة: البناء من أجل التعلم ، وليس فقط سهولة الاستخدام.
كان لكل عصر من حقبة الحوسبة حلقات التعلم الخاصة به. عصر الكمبيوتر الشخصي: الحلقات اليدوية مثل تقارير الأخطاء. عصر الويب: الحلقات البرمجية مثل النقرات. عصر الذكاء الاصطناعي: حلقات التعلم الذاتي مثل علامات التبويب ، والقبول / الرفض ، والمسودات.
في منتجات الذكاء الاصطناعي ، تكون الواجهة هي سطح التغذية المرتدة. كل قبول أو تحرير أو حذف يعلم النموذج شيئا ما. لذا فإن سؤال تصميم المنتج لم يعد مجرد "هل هو سهل الاستخدام؟" إنه أيضا "هل يمكن للنظام التعلم من الاستخدام؟"
‏‎1.11‏K