Așa cum era de așteptat, NSA nu este compatibil cu MLA, așa că DeepSeek a ales o altă metodă: să folosească o atenție mai mică (d=128) (fără valoare) ca indexator. Raportul costurilor asimptotice = 128/576. În plus, indexatorul folosește FP8, în timp ce MLA principal folosește 16 biți, deci = 64/576 = 1/9.