DeepSeek-V3.2 arată: - Cipurile chinezești sunt în creștere: suport pentru Huawei Ascend și Cambricon; - Compilator ML: DeepSeek folosește TileLang, permițându-vă să scrieți Python → să compilați în nuclee optimizate pe hardware divers. De exemplu, 80 de linii de Python pot ajunge la 95% din performanța FlashMLA (CUDA scris de mână). Sub capota TileLang se află TVM, un compilator ML la care am petrecut ani de zile lucrând cu marea comunitate open-source. Pe măsură ce peisajul hardware se diversifică (GPU-uri Nvidia, cipuri chinezești și cipuri axate pe inferență), compilatoarele ML vor străluci din nou.
Dacă sunteți nou în compilatoarele ML, vă recomand cu căldură Cursul MLC al @tqchenml la CMU, are videoclipuri și cod: . Folosește stiva TVM (nivel grafic IR: relaxare + nivel tensor IR: TensorIR) ca exemple, dar ideile generale se aplică altor compilatoare ML.
@tqchenml Uau
64,65K