Prisslaktaren DeepSeek har gjort ett annat drag, även om prestandan har sjunkit lite, men det här priset är som Mixue Bingcheng, vilket gör att folk inte har något att säga. Ny modell använder DeepSeek Sparse Attention (DSA) För första gången implementeras en finkornig mekanism för gles uppmärksamhet, vilket avsevärt förbättrar effektiviteten i träning och resonemang av lång text utan att påverka modellens utdataeffekt.