راجع للشغل ، أصدروا الغوص العميق على FP8 KVCache من MLA الرئيسي. لذلك ، في الواقع ≈1/5 مقارنة ب FP8 MLA الكثيف.