🚀 第0天支持:Kimi K2 Thinking 现在在 vLLM 上运行! 与 @Kimi_Moonshot 合作,我们自豪地提供对最先进的开放思维模型的官方支持,该模型具有 1T 参数,32B 活跃。 在 vLLM(夜间版本)中轻松部署,支持 OpenAI 兼容 API: 它的特别之处: ⚡ 原生 INT4 量化 → 推理速度提高 2 倍 💾 内存占用减半,无准确性损失 🎯 256K 上下文,在 200-300 次工具调用中稳定 🎯 包含官方配方和部署指南 世界级推理,现在人人可及。 📦 模型: 📚 配方: #vLLM #KimiK2 #LLMInference