🚀 Suport pentru ziua 0: Kimi K2 Thinking rulează acum pe vLLM! În parteneriat cu @Kimi_Moonshot, suntem mândri să oferim suport oficial pentru modelul de gândire deschisă de ultimă generație cu parametri 1T, 32B activi. Implementare ușoară în vLLM (versiune nocturnă) cu API compatibil OpenAI: Ce îl face special: ⚡ Cuantificarea nativă INT4 → inferență 2× mai rapidă 💾 Jumătate din amprenta de memorie, fără pierderi de precizie 🎯 Context de 256K, stabil pe 200-300 de apeluri de instrumente 🎯 Rețetă oficială și ghid de implementare inclus Raționament de clasă mondială, acum accesibil tuturor. 📦 Model: 📚 Reţete: #vLLM #KimiK2 #LLMInference