🙌LLM alle-til-enhver verden ønsker Ming-flash-omni-forhåndsvisning velkommen, med en kraftig 103B-A9B-bue gjort svært effektiv gjennom sparsom MoE. Den etablerer en ny målestokk for omnimodal ytelse med åpen kildekode i forståelse og generering: 1. Kontrollerbar bildegenerering: Vi introduserer generativ segmentering som redigering, som muliggjør presis kontroll på pikselnivå. Modellen oppnådde en poengsum på *0,90* på GenEval-referansen. 2. Streaming Video Understanding: Forbedrede muligheter for detaljert og sømløs audiovisuell forståelse. 3. Dialektgjenkjenning: Oppnå SOTA-ytelse i kinesisk dialekt ASR, demonstrere ferdigheter på tvers av ulike dialekter som Hunanesi, Kantonesisk og Minnanesisk. #OpenSourceModels