VisualMimic ermöglicht humanoide Loco-Manipulation durch Sim-to-Real. Durch die Verwendung von egozentrischer Sicht, einem Low-Level-Keypoint-Tracker und einer High-Level-Policy wird ein Zero-Shot-Transfer für Aufgaben wie das Schieben von Kisten erreicht, wobei über Standorte und Lichtverhältnisse hinweg generalisiert wird.