Tencent merilis WeDLM-8B-Instruct Model bahasa difusi yang berjalan 3-6× lebih cepat daripada Qwen3-8B yang dioptimalkan vLLM pada tugas penalaran matematika. -3-6× lebih cepat daripada Qwen3-8B yang dioptimalkan vLLM pada tugas penalaran matematika - Mengungguli Qwen3-8B-Instruksi dasar pada sebagian besar tolok ukur - Kompatibel dengan cache KV asli (FlashAttention, PagedAttention, CUDA Graphs)