المزيد من التدريب المسبق يحسن أداء الروبوت الحقيقي لجيل الجيل 0 (عبر تقييمات A/B العمياء مع عمليات التدوير المغلقة). التحسينات كبيرة في نظام البيانات المنخفضة، لكن أفضل النماذج تزدهر مع كل من التدريب المسبق والتدريب الكافي بعده. انظر ملحق المدونة: