DeepSeek-V3.2 näyttää: - Kiinalaiset sirut ovat nousussa: Day-0-tuki Huawei Ascendille ja Cambriconille; - ML-kääntäjä: DeepSeek käyttää TileLangia, jonka avulla voit kirjoittaa Pythonia → kääntää optimoituihin ytimiin erilaisilla laitteistoilla. Esimerkiksi 80 riviä Pythonia voi saavuttaa 95 % FlashMLA:n (käsin kirjoitettu CUDA) suorituskyvystä. TileLangin konepellin alla on TVM, ML-kääntäjä, jonka parissa työskentelin vuosia suuren avoimen lähdekoodin yhteisön kanssa. Kun laitteistomaisema monipuolistuu (Nvidia GPU:t, kiinalaiset sirut ja päättelyyn keskittyvät sirut), ML-kääntäjät loistavat jälleen.
Jos olet uusi ML-kääntäjien käyttäjä, suosittelen lämpimästi @tqchenml MLC-kurssi CMU:ssa, siinä on videoita ja koodia: . Se käyttää esimerkkeinä TVM-pinoa (graafitason IR: rentoutuminen + tensoritason IR: TensorIR), mutta yleiset ideat pätevät muihin koneoppimiskääntäjiin.
@tqchenml Vau
64,65K