VisualMimic permite manipularea loco-umanoidă prin sim-to-real. Folosind viziunea egocentrică, un tracker de puncte cheie de nivel scăzut și o politică de nivel înalt realizează transferul zero-shot pentru sarcini precum împingerea cutiei, generalizarea în toate locațiile și condițiile de iluminare.