Prisslakteren DeepSeek har gjort et nytt grep, selv om ytelsen har gått litt ned, men denne prisen er som Mixue Bingcheng, noe som gjør at folk ikke har noe å si. Ny modell bruker DeepSeek Sparse Attention (DSA) For første gang implementeres en finkornet sparsom oppmerksomhetsmekanisme, som i stor grad forbedrer effektiviteten til lang teksttrening og resonnement uten å påvirke utgangseffekten til modellen.