O VisualMimic permite a loco-manipulação humanoide através de simulação para o real. Usando visão egocêntrica, um rastreador de pontos-chave de baixo nível e uma política de alto nível alcançam transferência zero-shot para tarefas como empurrar caixas, generalizando através de locais e condições de iluminação.