🚀 Dukungan Hari 0: Kimi K2 Thinking sekarang berjalan di vLLM! Dalam kemitraan dengan @Kimi_Moonshot, kami bangga memberikan dukungan resmi untuk model pemikiran terbuka yang canggih dengan parameter 1T, 32B aktif. Mudah diterapkan dalam vLLM (versi malam) dengan API yang kompatibel dengan OpenAI: Apa yang membuatnya istimewa: ⚡ Kuantisasi INT4 asli → inferensi 2× lebih cepat 💾 Setengah jejak memori, tidak ada kehilangan akurasi 🎯 Konteks 256K, stabil di 200-300 panggilan alat 🎯 Resep resmi & panduan penyebaran disertakan Penalaran kelas dunia, sekarang dapat diakses oleh semua orang. 📦 Pola: 📚 Resep: #vLLM #KimiK2 #LLMInference