El carnicero de precios DeepSeek ha hecho otro movimiento, aunque el rendimiento ha disminuido un poco, pero este precio es como Mixue Bingcheng, lo que hace que la gente no tenga nada que decir. El nuevo modelo utiliza DeepSeek Sparse Attention (DSA) Por primera vez, se implementa un mecanismo de atención dispersa de grano fino, que mejora en gran medida la eficiencia del entrenamiento y el razonamiento de texto largo sin afectar el efecto de salida del modelo.