BTW, de släppte en djupdykning på FP8 KVCache av huvud MLA. så faktiskt ≈1/5 jämfört med FP8 tät MLA.