Xiaomi har nettopp lansert MiMo-V2-Flash, en 309B åpen vekt resonnementsmodell som scorer 66 på Artificial Analysis Intelligence Index. Denne utgivelsen løfter Xiaomi opp blant andre ledende AI-modelllaboratorier. Viktige benchmarking-innsikter: ➤ Styrker innen bruk av agentiske verktøy og konkurransematematikk: MiMo-V2-Flash scorer 95 % på τ²-Bench Telecom og 96 % på AIME 2025, og viser sterk ytelse på agentiske verktøybruksflyter og konkurransebasert matematisk resonnement. MiMo-V2-Flash leder for tiden τ²-Bench Telecom-kategorien blant evaluerte modeller ➤ Kostnadskonkurransedyktig: Den komplette evalueringssuiten for kunstig analyse kostet bare 53 dollar å drive. Dette støttes av MiMo-V2-Flashs svært konkurransedyktige pris på 0,10 dollar per million input og 0,30 dollar per million utdata, noe som gjør det spesielt attraktivt for kostnadssensitive utrullinger og storskala produksjonsarbeidsbelastninger. Dette ligner på DeepSeek V3.2 (54 dollar total driftskostnad), og godt under GPT-5.2 (1 294 dollar total driftskostnad) ➤ Høy tokenbruk: MiMo-V2-Flash demonstrerer høy ordrikdom og tokenbruk sammenlignet med andre modeller i samme intelligensnivå, og bruker ~150 millioner resonnementstokene på tvers av Artificial Analysis Intelligence-pakken ➤ Åpne vekter: MiMo-V2-Flash er åpne vekter og har 309B parametere med 15B aktive ved inferenstidspunkt. Vekter slippes under en MIT-lisens, noe som fortsetter trenden med at kinesiske AI-modelllaboratorier åpner sine grensemodeller som åpen kildekode Se nedenfor for videre analyse:
MiMo-V2-Flash viser særlig styrke innen bruk av agentiske verktøy og konkurransematematikk, med 95 % poeng på τ²-Bench Telecom og 96 % på AIME 2025. Dette plasserer den blant de best presterende modellene i disse kategoriene.
MiMo-V2-Flash er en av de mest kostnadseffektive modellene for sin intelligens, priset til kun 0,10 dollar per million input-tokens og 0,30 dollar per million output-tokens.
MiMo-V2-Flash genererte ~150 millioner resonnementstokene mens den kjørte Artificial Analysis-evalueringssuiten, noe som gjør den til en av de mest tokenintensive modellene som testes – dette har latensimplikasjoner og oppveier noen av prisfordelene.
MiMo-V2-Flash scorer -62 på AA-Omniscience Index, hovedsakelig drevet av en relativt høy hallusinasjonsrate.
Individuelle resultater fra vårt Artificial Analysis Intelligence Index-sett med evalueringer:
Se Kunstig analyse for flere detaljer og benchmarks for MiMo-V2-Flash
4,8K