Talvez o top-k seja tudo o que você precisa. Primeiro veio para o MLP - MoEs estilo switch Agora está vindo para a atenção - atenção esparsa DSV3.2