Ще одна демонстрація продуктивності LLM iPhone 17 Pro на пристрої Цього разу з Ling mini 2.0 від @TheInclusionAI, моделлю 16B MoE з активними параметрами 1,4B, що працює на швидкості ~120 тк/с Спасибі @awnihannun за MLX DWQ 2-bit quants