Как и ожидалось, NSA несовместима с MLA, поэтому DeepSeek выбрал другой метод: использовать меньшую (d=128) внимательность (без значения) в качестве индексатора. Асимптотическое соотношение затрат = 128/576. Кроме того, индексатор использует FP8, в то время как основной MLA использует 16-битный формат, так что = 64/576 = 1/9.