Zoals verwacht is NSA niet compatibel met MLA, dus koos DeepSeek een andere methode: gebruik een kleinere (d=128) aandacht (zonder waarde) als de indexer. Asymptotische kostenverhouding = 128/576. Bovendien gebruikt de indexer FP8 terwijl de hoofd-MLA 16-bits gebruikt, dus = 64/576 = 1/9.