🚀 Supporto del Giorno 0: Kimi K2 Thinking ora in esecuzione su vLLM! In collaborazione con @Kimi_Moonshot, siamo orgogliosi di offrire supporto ufficiale per il modello di pensiero all'avanguardia con 1T parametri, 32B attivi. Facile distribuzione in vLLM (versione notturna) con API compatibile con OpenAI: Cosa lo rende speciale: ⚡ Quantizzazione nativa INT4 → inferenza 2× più veloce 💾 Metà dell'impronta di memoria, senza perdita di precisione 🎯 Contesto di 256K, stabile in 200-300 chiamate agli strumenti 🎯 Ricetta ufficiale e guida alla distribuzione inclusa Ragionamento di classe mondiale, ora accessibile a tutti. 📦 Modello: 📚 Ricette: #vLLM #KimiK2 #LLMInference