腾讯发布 WeDLM-8B-Instruct 一种扩散语言模型,在数学推理任务上运行速度比经过 vLLM 优化的 Qwen3-8B 快 3-6 倍。 - 在数学推理任务上比经过 vLLM 优化的 Qwen3-8B 快 3-6 倍 - 在大多数基准测试中优于基础版 Qwen3-8B-Instruct - 兼容原生 KV 缓存(FlashAttention、PagedAttention、CUDA 图)