O autor do Native Sparse Attention, Ex-DeepSeek, ganhou o prêmio de melhor artigo da ACL. Tive a sorte de assistir a uma palestra ao vivo onde ele revelou: - aumentar o comprimento do contexto para 1 milhão - isso estará no próximo modelo de fronteira Há boas razões para acreditar que o DeepSeek V4 usará NSA.