Mer fortrening forbedrer ytelsen til GEN-0 med ekte roboter (via blinde A/B-evalueringer med lukkede sløyfe-utrullinger). Forbedringer er betydelige i lavdata-regimet, men de beste modellene trives både med fortrening og rikelig med ettertrening. Se bloggens tillegg: