Un'altra demo delle prestazioni LLM on-device dell'iPhone 17 Pro Questa volta con Ling mini 2.0 di @TheInclusionAI, un modello MoE da 16B con 1,4B di parametri attivi che funziona a ~120tk/s Grazie a @awnihannun per i quanti 2-bit MLX DWQ