一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

腾讯发布 WeDLM-8B-Instruct 一种扩散语言模型，在数学推理任务上运行速度比经过 vLLM 优化的 Qwen3-8B 快 3-6 倍。 - 在数学推理任务上比经过 vLLM 优化的 Qwen3-8B 快 3-6 倍 - 在大多数基准测试中优于基础版 Qwen3-8B-Instruct - 兼容原生 KV 缓存（FlashAttention、PagedAttention、CUDA 图）