🚨Il team di DeepSeek ha trovato un contesto lungo economico per i LLM: un prefill ~3,5 volte più economico e un decode ~10 volte più economico a 128k di contesto durante l'inferenza con la stessa qualità. Non posso fare a meno di amare l'unico laboratorio di AI all'avanguardia che pubblica un modello aperto e una grande ricerca aperta!
Rapporto Tecnico:
31,59K