Por cierto, lanzaron una inmersión profunda en FP8 KVCache del MLA principal. por lo tanto, en realidad ≈1/5 en comparación con el MLA denso FP8.