Lavida-O Elastyczne Duże Maskowane Modele Dyfuzji dla Zjednoczonego Multimodalnego Zrozumienia i Generacji