🚀SonicMoE🚀: en blixtsnabb MoE-implementation optimerad för NVIDIA Hopper-GPU:er. SonicMoE minskar aktiveringsminnet med 45 % och är 1,86 gånger snabbare på H100 än tidigare SOTA😃 Papper: Arbeta med @MayankMish98, @XinleC295, @istoica05, @tri_dao