عرض توضيحي آخر لأداء LLM على الجهاز لآي-فون 17 برو هذه المرة مع Ling mini 2.0 by @TheInclusionAI ، نموذج 16B MoE مع 1.4B معلمات نشطة تعمل بسرعة ~ 120tk / s بفضل @awnihannun لكميات MLX DWQ 2 بت