Toinen demo iPhone 17 Pron LLM-suorituskyvystä laitteessa Tällä kertaa Ling mini 2.0 by @TheInclusionAI:lla, 16B MoE-mallilla, jossa on 1.4B aktiivisia parametreja, jotka toimivat nopeudella ~120tk/s Kiitos @awnihannun MLX DWQ 2-bittisille kvanteille