Dette er veldig interessant fra 'MMaDA-Parallel: Multimodale store diffusjonsspråkmodeller for tenkebevisst redigering og generering'