🚀SonicMoE🚀: uma implementação de MoE incrivelmente rápida, otimizada para GPUs NVIDIA Hopper. O SonicMoE reduz a memória de ativação em 45% e é 1,86x mais rápido no H100 do que o SOTA😃 anterior Papel: Trabalhe com @MayankMish98, @XinleC295, @istoica05 @tri_dao