Lavida-O Elastiske store maskerte diffusjonsmodeller for enhetlig multimodal forståelse og generering