🚀 Day 0 サポート: Kimi K2 Thinking が vLLM で実行中です! @Kimi_Moonshot とのパートナーシップにより、1T パラメータ、32B アクティブを備えた最先端のオープン思考モデルを公式にサポートできることを誇りに思っています。 OpenAI 互換 API を使用して vLLM (ナイトリー バージョン) に簡単にデプロイできます。 何が特別なのか: ⚡ ネイティブINT4量子化→2×速い推論 💾 メモリフットプリントが半分で、精度が損なわれない 🎯 256Kコンテキスト、200〜300のツール呼び出しで安定 🎯 公式レシピと展開ガイドが含まれています 世界クラスの推論が、誰でもアクセスできるようになりました。 📦 モデル: 📚 レシピ: #vLLM #KimiK2 #LLMInference