🙌O LLM any-to-any world dá as boas-vindas ao Ming-flash-omni-preview, apresentando um poderoso arco 103B-A9B altamente eficiente por meio de MoE esparso. Ele estabelece uma nova referência para o desempenho omnimodal de código aberto na compreensão e geração: 1. Geração de imagem controlável: Apresentando a segmentação generativa como edição, que permite um controle preciso em nível de pixel. O modelo alcançou uma pontuação de *0,90* no benchmark GenEval. 2. Compreensão de streaming de vídeo: recursos aprimorados para compreensão audiovisual detalhada e contínua. 3. Reconhecimento de dialeto: Atingir o desempenho SOTA no dialeto chinês ASR, demonstrando proficiência em diversos dialetos, como hunanese, cantonês e minnanês. #OpenSourceModels