🚀SonicMoE🚀 : une implémentation MoE ultra-rapide optimisée pour les GPU NVIDIA Hopper. SonicMoE réduit la mémoire d'activation de 45 % et est 1,86 fois plus rapide sur H100 que le précédent SOTA😃 Article : Travail avec @MayankMish98, @XinleC295, @istoica05, @tri_dao