Nok en demo av iPhone 17 Pros LLM-ytelse på enheten Denne gangen med Ling mini 2.0 by @TheInclusionAI, en 16B MoE-modell med 1,4B aktive parametere som kjører på ~120tk/s Takket være @awnihannun for MLX DWQ 2-bits kvanter