🚀SonicMoE🚀: o implementare MoE extrem de rapidă, optimizată pentru plăcile video NVIDIA Hopper. SonicMoE reduce memoria de activare cu 45% și este de 1,86 ori mai rapid pe H100 decât SOTA😃 anterior Hârtie: Lucrează cu @MayankMish98, @XinleC295, @istoica05, @tri_dao