🙌El LLM de cualquier mundo da la bienvenida a Ming-flash-omni-preview, con un potente arco 103B-A9B altamente eficiente a través de un MoE disperso. Establece un nuevo punto de referencia para el rendimiento omnimodal de código abierto en la comprensión y generación: 1. Generación de imágenes controlables: Presentamos la segmentación generativa como edición, que permite un control preciso a nivel de píxeles. El modelo logró una puntuación de *0.90* en el punto de referencia GenEval. 2. Comprensión de transmisión de video: capacidades mejoradas para una comprensión audiovisual detallada y fluida. 3. Reconocimiento de dialectos: Lograr el desempeño de SOTA en el dialecto chino ASR, demostrando competencia en diversos dialectos como el hunanés, el cantonés y el minnanés. #OpenSourceModels