يعمل نموذج Kimi K2 Thinking الجديد المكون من 1 تريليون معلمة بشكل جيد على 2 M3 Ultras بتنسيقه الأصلي - لا يوجد خسارة في الجودة! كان النموذج مدركا على التكميم (qat) في int4. هنا أنتجت ~ 3500 رمز مميز بمعدل 15 توكس / ثانية باستخدام موازاة خط الأنابيب في mlx-lm:
لقد ولدت لعبة غزاة الفضاء التي تعمل بكامل طاقتها لا مشكلة. استخدمت فقط بضع مئات من رموز التفكير و 3500 بشكل عام وهو أمر رائع للغاية.
‏‎328.11‏K