Mantan penulis DeepSeek Native Sparse Attention memenangkan penghargaan makalah terbaik ACL. Saya cukup beruntung untuk menghadiri kuliah langsung di mana dia mengungkapkan: - meningkatkan panjang konteks menjadi 1 juta - Ini akan ada di model Frontier berikutnya Ada alasan bagus untuk percaya DeepSeek V4 akan menggunakan NSA.