BTW, eles lançaram um mergulho profundo no FP8 KVCache do MLA principal. então, na verdade, ≈1/5 em comparação com o MLA denso FP8.