Tencent wydaje WeDLM-8B-Instruct Model językowy dyfuzyjny, który działa 3-6× szybciej niż zoptymalizowany vLLM Qwen3-8B w zadaniach związanych z rozumowaniem matematycznym. - 3-6× szybciej niż zoptymalizowany vLLM Qwen3-8B w zadaniach związanych z rozumowaniem matematycznym - Przewyższa podstawowy Qwen3-8B-Instruct w większości benchmarków - Kompatybilny z natywną pamięcią KV (FlashAttention, PagedAttention, CUDA Graphs)