価格の肉屋であるDeepSeekは、パフォーマンスが少し低下しましたが、この価格はMixue Bingchengのようなもので、人々は何も言うことはありません。 新しいモデルは DeepSeek Sparse Attention (DSA) を使用します きめ細かなスパースアテンションメカニズムが初めて実装され、モデルの出力効果に影響を与えることなく、長文のトレーニングと推論の効率が大幅に向上します。