🚀 Поддержка Дня 0: Kimi K2 Thinking теперь работает на vLLM! В партнерстве с @Kimi_Moonshot мы гордимся тем, что предоставляем официальную поддержку передовой модели открытого мышления с 1T параметрами и 32B активными. Легкое развертывание в vLLM (ночная версия) с совместимым API OpenAI: Что делает это особенным: ⚡ Нативная квантование INT4 → в 2 раза быстрее вывод 💾 Вдвое меньший объем памяти, без потери точности 🎯 256K контекста, стабильно при 200-300 вызовах инструментов 🎯 Включены официальные рецепты и руководство по развертыванию Мировой уровень рассуждений, теперь доступный для всех. 📦 Модель: 📚 Рецепты: #vLLM #KimiK2 #LLMInference