🚀SonicMoE🚀:NVIDIA Hopper GPU向けに最適化された超高速MoE実装。SonicMoEは起動メモリを45%削減し、H100では従来のSOTA😃より1.86倍高速です 論文: @MayankMish98、@XinleC295、@istoica05、@tri_daoと共に作業します。