بشكل مثير للدهشة يمكنني الحصول على سرعات قابلة للاستخدام على qwen 232b على جهاز الكمبيوتر الخاص بي باستخدام وحدة المعالجة المركزية فقط
@wondering_camel بشكل أساسي سرعات GPT4.5 لول
@nirw4nna @lmstudio @ggerganov هل يجب أن يكون إصدار nxfp4 أسرع على الرغم من أنني أتساءل
‏‎5.15‏K