Cenový řezník DeepSeek udělal další krok, i když výkon trochu klesl, ale tato cena je jako Mixue Bingcheng, díky čemuž lidé nemají co říct. Nový model využívá technologii DeepSeek Sparse Attention (DSA) Poprvé je implementován jemnozrnný mechanismus řídké pozornosti, který výrazně zlepšuje efektivitu trénování dlouhých textů a uvažování, aniž by to ovlivnilo výstupní efekt modelu.