Trouwens, ze hebben een diepgaande analyse vrijgegeven over FP8 KVCache van de belangrijkste MLA. Dus, eigenlijk ≈1/5 vergeleken met FP8 dichte MLA.