Ännu en demo av iPhone 17 Pros LLM-prestanda på enheten Den här gången med Ling mini 2.0 by @TheInclusionAI, en 16B MoE-modell med 1,4B aktiva parametrar som körs med ~120tk/s Tack vare @awnihannun för MLX DWQ 2-bitars kvanter