🚀SonicMoE🚀: uma implementação de MoE incrivelmente rápida otimizada para GPUs NVIDIA Hopper. SonicMoE reduz a memória de ativação em 45% e é 1.86x mais rápido no H100 do que o SOTA anterior😃 Artigo: Trabalho com @MayankMish98, @XinleC295, @istoica05, @tri_dao