Były autor DeepSeek, Native Sparse Attention, zdobył nagrodę za najlepszy artykuł na ACL. Miałem szczęście uczestniczyć w wykładzie na żywo, gdzie ujawnił: - zwiększenie długości kontekstu do 1 miliona - to będzie w następnym modelu frontier Są dobre powody, by wierzyć, że DeepSeek V4 będzie używał NSA.