O ex-autor do DeepSeek de Native Sparse Attention ganhou o prêmio de melhor artigo do ACL. Tive a sorte de assistir a uma palestra ao vivo onde ele revelou: - Aumentar o comprimento do contexto para 1 milhão - Isso será no próximo modelo de fronteira Há boas razões para acreditar que o DeepSeek V4 usará a NSA.