Een andere demo van de on-device LLM-prestaties van de iPhone 17 Pro Deze keer met Ling mini 2.0 van @TheInclusionAI, een 16B MoE-model met 1,4B actieve parameters die draaien op ~120tk/s Dank aan @awnihannun voor de MLX DWQ 2-bits quantificaties