🙌LLM any-to-any world menyambut pratinjau Ming-flash-omni-preview, menampilkan lengkungan 103B-A9B yang kuat yang dibuat sangat efisien melalui MoE yang jarang. Ini menetapkan tolok ukur baru untuk kinerja omni-modal sumber terbuka dalam pemahaman dan pembuatan: 1. Pembuatan Gambar yang Dapat Dikontrol: Memperkenalkan Segmentasi Generatif-sebagai-Pengeditan, yang memungkinkan kontrol tingkat piksel yang tepat. Model ini mencapai skor *0,90* pada tolok ukur GenEval. 2. Pemahaman Video Streaming: Kemampuan yang ditingkatkan untuk pemahaman audio-visual yang terperinci dan mulus. 3. Pengakuan Dialek: Mencapai kinerja SOTA dalam Dialek Cina ASR, menunjukkan kemahiran di berbagai dialek seperti Hunan, Kanton, dan Minnan. #OpenSourceModels