O açougueiro de preços DeepSeek fez outro movimento, embora o desempenho tenha caído um pouco, mas esse preço é como o Mixue Bingcheng, o que faz com que as pessoas não tenham nada a dizer. Novo modelo usa DeepSeek Sparse Attention (DSA) Pela primeira vez, um mecanismo de atenção esparsa refinado é implementado, o que melhora muito a eficiência do treinamento e raciocínio de texto longo sem afetar o efeito de saída do modelo.