Entinen DeepSeek-kirjailija Native Sparse Attention voitti ACL:n parhaan artikkelin palkinnon. Minulla oli onni osallistua live-luennolle, jossa hän paljasti: - kontekstin pituuden skaalaaminen 1 miljoonaan - Tämä on Next Frontier -mallissa On hyvä syy uskoa, että DeepSeek V4 käyttää NSA:ta.