Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek-V3.2 cho thấy:
- Chip Trung Quốc đang tăng: Hỗ trợ Day-0 cho Huawei Ascend & Cambricon;
- Biên dịch viên ML: DeepSeek sử dụng TileLang, cho phép bạn viết Python → biên dịch thành các kernel tối ưu trên phần cứng đa dạng. Ví dụ, 80 dòng Python có thể đạt 95% hiệu suất của FlashMLA (CUDA viết bằng tay).
Dưới nắp của TileLang là TVM, một biên dịch viên ML mà tôi đã dành nhiều năm làm việc cùng với cộng đồng mã nguồn mở tuyệt vời. Khi cảnh quan phần cứng đa dạng hóa (GPU Nvidia, chip Trung Quốc và chip tập trung vào suy diễn), các biên dịch viên ML sẽ lại tỏa sáng.

Nếu bạn mới bắt đầu với các trình biên dịch ML, tôi rất khuyên bạn nên tham gia khóa học MLC của @tqchenml tại CMU, nó có video và mã: .
Nó sử dụng ngăn xếp TVM (IR cấp đồ thị: relax + IR cấp tensor: TensorIR) làm ví dụ, nhưng các ý tưởng chung áp dụng cho các trình biên dịch ML khác.
@tqchenml Wow

64,66K
Hàng đầu
Thứ hạng
Yêu thích