🚀 Dag 0 støtte: Kimi K2 tenker nå kjører på vLLM! I samarbeid med @Kimi_Moonshot er vi stolte av å levere offisiell støtte til den toppmoderne åpne tenkemodellen med 1T-parametere, 32B aktive. Enkel distribusjon i vLLM (nattlig versjon) med OpenAI-kompatibel API: Hva gjør det spesielt: ⚡ Native INT4-kvantisering → 2 × raskere slutning 💾 Halvparten av minneavtrykket, ingen tap av nøyaktighet 🎯 256K kontekst, stabil på tvers av 200–300 verktøykall 🎯 Offisiell oppskrifts- og distribusjonsveiledning inkludert Resonnement i verdensklasse, nå tilgjengelig for alle. 📦 Modell: 📚 Oppskrifter: #vLLM #KimiK2 #LLMInference