Lavida-O Modelos de Difusão Grande Elásticos Mascarados para Compreensão e Geração Multimodal Unificada