🙌Die LLM Any-to-Any-Welt begrüßt Ming-flash-omni-preview, das mit einer leistungsstarken 103B-A9B-Architektur ausgestattet ist, die durch sparsames MoE hochgradig effizient gemacht wurde. Es setzt einen neuen Maßstab für die Leistung von Open-Source-Omni-Modalen in Verständnis und Generierung: 1. Kontrollierbare Bildgenerierung: Einführung von Generative Segmentation-as-Editing, das präzise, pixelgenaue Kontrolle ermöglicht. Das Modell erreichte einen Score von *0.90* im GenEval-Benchmark. 2. Streaming-Video-Verständnis: Verbesserte Fähigkeiten für detailliertes und nahtloses audio-visuelles Verständnis. 3. Dialekterkennung: Erzielung von SOTA-Leistung in der chinesischen Dialekt-ASR, die Kompetenz über verschiedene Dialekte wie Hunanesisch, Kantonesisch und Minnanesisch demonstriert. #OpenSourceModels