Más preentrenamiento mejora el rendimiento del robot real GEN-0 (mediante evaluaciones A/B a ciegas con despliegues en bucle cerrado). Las mejoras son significativas en el régimen de pocos datos, pero los mejores modelos prosperan tanto con el preentrenamiento como con el postentrenamiento abundante. Ver apéndice del blog: