Comme prévu, NSA n'est pas compatible avec MLA, donc DeepSeek a choisi une autre méthode : utiliser une attention plus petite (d=128) (sans valeur) comme indexeur. Le ratio de coût asymptotique = 128/576. De plus, l'indexeur utilise FP8 tandis que le MLA principal utilise 16 bits, donc = 64/576 = 1/9.