До речі, вони випустили глибоке занурення на FP8 KVCache основного MLA. отже, фактично ≈1/5 у порівнянні з FP8 щільним MLA.