🚀 День 0 підтримки: Kimi K2 Thinking тепер працює на vLLM! У партнерстві з @Kimi_Moonshot ми пишаємося тим, що надаємо офіційну підтримку найсучаснішої моделі відкритого мислення з параметрами 1T, 32B active. Легке розгортання в vLLM (нічна версія) з OpenAI-сумісним API: Чим він особливий: ⚡ Власне квантування INT4 → 2× швидшого висновку 💾 Половина обсягу пам'яті, без втрати точності 🎯 Контекст 256K, стабільний на 200-300 дзвінків інструментів 🎯 Офіційний рецепт і посібник із розгортання включено Міркування світового рівня, тепер доступні кожному. 📦 Модель: 📚 Рецепти: #vLLM #KimiK2 #LLMInference