Cenowy rzeźnik DeepSeek znów uderzył, chociaż wydajność nieco spadła, to ta cena jest jak w Mikołajkach, nie ma co mówić. Nowy model wykorzystuje DeepSeek Sparse Attention (DSA) po raz pierwszy wprowadza drobnoziarnisty mechanizm rzadkiej uwagi, osiągając znaczny wzrost efektywności treningu i wnioskowania długich tekstów, niemal bez wpływu na wyniki wyjściowe modelu.