نيموترون 3 نانو يعمل بشكل جيد مع mlx-lm على M4 Max. قد يكون نموذجا رائعا للاستخدام المحلي على ماك: MoE + الانتباه الهجين يجعله سريعا حتى في السياق الطويل جدا. التوليد في الوقت الحقيقي باستخدام نموذج 4-بت: