Lavida-O Modelos de difusão mascarados grandes elásticos para compreensão e geração multimodal unificadas