على عكس التدريب المسبق ، فإن RL posttraining هي عملية مشاركة نشطة للغاية. يجب أن تراقب عمليات الطرح ، وتعديل المكافآت ، وإضافة / إزالة / تعديل المهام باستمرار إذا كنت تريد نتائج جيدة.