🚀SonicMoE🚀: un'implementazione MoE incredibilmente veloce ottimizzata per le GPU NVIDIA Hopper. SonicMoE riduce la memoria di attivazione del 45% ed è 1,86 volte più veloce su H100 rispetto al precedente SOTA😃 Carta: Lavoro con @MayankMish98, @XinleC295, @istoica05, @tri_dao