🚀SonicMoE🚀: implementasi MoE yang sangat cepat yang dioptimalkan untuk GPU NVIDIA Hopper. SonicMoE mengurangi memori aktivasi sebesar 45% dan 1,86x lebih cepat pada H100 daripada SOTA😃 sebelumnya Kertas: Bekerja dengan @MayankMish98, @XinleC295, @istoica05, @tri_dao