El carnicero de precios DeepSeek ha vuelto a actuar, aunque el rendimiento ha disminuido un poco, pero este precio es como el de Mixue Ice City, dejándonos sin palabras. El nuevo modelo utiliza DeepSeek Sparse Attention (DSA) que ha logrado por primera vez un mecanismo de atención dispersa de grano fino, logrando una mejora significativa en la eficiencia del entrenamiento y la inferencia de textos largos sin afectar casi nada la calidad de salida del modelo.