顺便说一下,他们发布了关于主MLA的FP8 KVCache的深入分析。 所以,实际上与FP8稠密MLA相比大约是1/5。