يظهر DeepSeek-V3.2: - الرقائق الصينية آخذة في الارتفاع: دعم اليوم 0 لشركة Huawei Ascend و Cambricon. - مترجم ML: يستخدم DeepSeek TileLang ، مما يتيح لك كتابة Python → التحويل البرمجي إلى النواة المحسنة على أجهزة متنوعة. على سبيل المثال ، يمكن أن تصل 80 سطرا من Python إلى 95٪ من أداء FlashMLA (CUDA المكتوب يدويا). تحت غطاء TileLang يوجد TVM ، وهو مترجم ML قضيت سنوات في العمل عليه مع مجتمع مفتوح المصدر الرائع. مع تنوع مشهد الأجهزة (وحدات معالجة الرسومات Nvidia والرقائق الصينية والرقائق التي تركز على الاستدلال) ، سوف تتألق مجمعات ML مرة أخرى.
إذا كنت جديدا في مترجمات ML ، فإنني أوصي بشدة دورة MLC الخاصة ب @tqchenml في جامعة كارنيجي ميلون ، تحتوي على مقاطع فيديو وتعليمات برمجية: . إنه يستخدم مكدس TVM (مستوى الرسم البياني IR: الاسترخاء + مستوى الموتر IR: TensorIR) كأمثلة ، ولكن الأفكار العامة تنطبق على مترجمي ML الآخرين.
@tqchenml واو
‏‎47.47‏K