🙌El mundo LLM de cualquier a cualquier da la bienvenida a Ming-flash-omni-preview, que presenta una potente arquitectura 103B-A9B hecha altamente eficiente a través de MoE disperso. Establece un nuevo estándar para el rendimiento omni-modal de código abierto en comprensión y generación: 1. Generación de Imágenes Controlable: Introduciendo Segmentación Generativa como Edición, que permite un control preciso a nivel de píxel. El modelo logró una puntuación de *0.90* en el benchmark GenEval. 2. Comprensión de Video en Streaming: Capacidades mejoradas para una comprensión audio-visual detallada y fluida. 3. Reconocimiento de Dialectos: Alcanzando un rendimiento SOTA en ASR de Dialecto Chino, demostrando competencia en diversos dialectos como el Hunanés, Cantonés y Minnanés. #OpenSourceModels