Por cierto, lanzaron un análisis profundo sobre el KVCache de FP8 del MLA principal. Así que, en realidad, ≈1/5 en comparación con el MLA denso de FP8.