Tukang daging harga DeepSeek telah membuat langkah lain, meskipun kinerjanya sedikit menurun, tetapi harga ini seperti Mixue Bingcheng, yang membuat orang tidak punya apa-apa untuk dikatakan. Model baru menggunakan DeepSeek Sparse Attention (DSA) Untuk pertama kalinya, mekanisme perhatian jarang yang halus diterapkan, yang sangat meningkatkan efisiensi pelatihan dan penalaran teks panjang tanpa memengaruhi efek keluaran model.