🙌LLM any-to-any world toivottaa tervetulleeksi Ming-flash-omni-preview'n, jossa on tehokas 103B-A9B-kaari, joka on tehty erittäin tehokkaaksi harvalla MoE:llä. Se luo uuden vertailukohdan avoimen lähdekoodin omnimodaaliselle suorituskyvylle ymmärtämisessä ja luomisessa: 1. Ohjattava kuvan luonti: Esittelyssä generatiivinen segmentointi muokkauksena, joka mahdollistaa tarkan pikselitason ohjauksen. Malli saavutti pistemäärän *0,90* GenEval-vertailussa. 2. Suoratoistovideon ymmärtäminen: Parannetut ominaisuudet yksityiskohtaiseen ja saumattomaan audiovisuaaliseen ymmärtämiseen. 3. Murteen tunnistus: SOTA-suorituskyvyn saavuttaminen kiinan murteen ASR:ssä, mikä osoittaa taitoa eri murteissa, kuten hunanissa, kantoninkiinassa ja minnanelaisessa. #OpenSourceModels