Măcelarul de prețuri DeepSeek a făcut o altă mișcare, deși performanța a scăzut puțin, dar acest preț este ca Mixue Bingcheng, ceea ce îi face pe oameni să nu aibă nimic de spus. Noul model folosește DeepSeek Sparse Attention (DSA) Pentru prima dată, este implementat un mecanism de atenție rară, care îmbunătățește considerabil eficiența antrenamentului și raționamentului textului lung, fără a afecta efectul de ieșire al modelului.