🙌 Świat LLM any-to-any wita Ming-flash-omni-preview, który charakteryzuje się potężną architekturą 103B-A9B, uczynioną wysoce efektywną dzięki rzadkiej MoE. Ustanawia nowy standard wydajności omni-modal w otwartym źródle w zakresie rozumienia i generacji: 1. Kontrolowana Generacja Obrazów: Wprowadzenie Generatywnej Segmentacji jako Edycji, która umożliwia precyzyjną kontrolę na poziomie pikseli. Model osiągnął wynik *0.90* w benchmarku GenEval. 2. Zrozumienie Wideo w Strumieniu: Ulepszone możliwości szczegółowego i płynnego zrozumienia audio-wizualnego. 3. Rozpoznawanie Dialektów: Osiągnięcie wydajności SOTA w ASR dla dialektów chińskich, demonstrując biegłość w różnych dialektach, takich jak hunan, kantoński i minnan. #OpenSourceModels