Le boucher de prix DeepSeek a encore frappé, bien que les performances aient légèrement diminué, ce prix est tout simplement incroyable, comme chez Mixue Ice City. Le nouveau modèle utilise l'attention éparse DeepSeek (DSA) Il a réalisé pour la première fois un mécanisme d'attention éparse à grain fin, permettant une amélioration significative de l'efficacité de l'entraînement et de l'inférence sur de longs textes, sans presque affecter la qualité de sortie du modèle.