Jak se dalo očekávat, NSA není kompatibilní s MLA, takže DeepSeek zvolil jinou metodu: jako indexátor použijte menší (d=128) pozornost (bez hodnoty). Asymptotický nákladový poměr = 128/576. Kromě toho, indexer používá FP8, zatímco hlavní MLA používá 16bitový, takže = 64/576 = 1/9.