🚀SonicMoE🚀: een razendsnelle MoE-implementatie geoptimaliseerd voor NVIDIA Hopper GPU's. SonicMoE vermindert de activatiemongeheugen met 45% en is 1,86x sneller op H100 dan de vorige SOTA😃 Paper: Werk samen met @MayankMish98, @XinleC295, @istoica05, @tri_dao