Hintateurastaja DeepSeek on tehnyt toisen liikkeen, vaikka suorituskyky on hieman heikentynyt, mutta tämä hinta on kuin Mixue Bingcheng, mikä tekee ihmisistä mitään sanottavaa. Uusi malli käyttää DeepSeek Sparse Attention (DSA) -tekniikkaa Ensimmäistä kertaa otetaan käyttöön hienorakeinen harva huomiomekanismi, joka parantaa huomattavasti pitkän tekstin harjoittelun ja päättelyn tehokkuutta vaikuttamatta mallin tulostehoon.