Лавіда-О Еластичні великі замасковані дифузійні моделі для уніфікованого мультимодального розуміння та генерації