Som förväntat är NSA inte kompatibelt med MLA, så DeepSeek valde en annan metod: använd en mindre (d=128) uppmärksamhet (w/o-värde) som indexerare. Asymptotisk kostnadskvot = 128/576. Dessutom använder indexeraren FP8 medan huvud-MLA använder 16-bitars, så = 64/576 = 1/9.