Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tencent merilis WeDLM-8B-Instruct
Model bahasa difusi yang berjalan 3-6× lebih cepat daripada Qwen3-8B yang dioptimalkan vLLM pada tugas penalaran matematika.
-3-6× lebih cepat daripada Qwen3-8B yang dioptimalkan vLLM pada tugas penalaran matematika
- Mengungguli Qwen3-8B-Instruksi dasar pada sebagian besar tolok ukur
- Kompatibel dengan cache KV asli (FlashAttention, PagedAttention, CUDA Graphs)

Teratas
Peringkat
Favorit
