VisualMimic memungkinkan manipulasi lokomotif humanoid melalui sim-to-real. Menggunakan visi egosentris, pelacak keypoint tingkat rendah dan kebijakan tingkat tinggi mencapai transfer zero-shot untuk tugas-tugas seperti mendorong kotak, menggeneralisasi lintas lokasi, dan kondisi pencahayaan.