Som forventet er ikke NSA kompatibel med MLA, så DeepSeek valgte en annen metode: bruk en mindre (d=128) oppmerksomhet (uten verdi) som indekserer. Asymptotisk kostnadsforhold = 128/576. I tillegg bruker indekserer FP8 mens hoved-MLA bruker 16-bit, så = 64/576 = 1/9.