🙌 O mundo LLM any-to-any dá as boas-vindas ao Ming-flash-omni-preview, apresentando uma poderosa arquitetura 103B-A9B tornada altamente eficiente através de MoE esparso. Estabelece um novo padrão para o desempenho omni-modal de código aberto em compreensão e geração: 1. Geração de Imagens Controlável: Introduzindo Segmentação Generativa como Edição, que permite um controle preciso a nível de pixel. O modelo alcançou uma pontuação de *0.90* no benchmark GenEval. 2. Compreensão de Vídeo em Streaming: Capacidades aprimoradas para uma compreensão áudio-visual detalhada e sem interrupções. 3. Reconhecimento de Dialetos: Alcançando desempenho SOTA em ASR de Dialeto Chinês, demonstrando proficiência em diversos dialetos como Hunanês, Cantonês e Minnanês. #OpenSourceModels