Nhân tiện, họ đã phát hành một bài phân tích sâu về FP8 KVCache của MLA chính. Vì vậy, thực tế là ≈1/5 so với FP8 MLA dày đặc.