L'autore di DeepSeek, Native Sparse Attention, ha vinto il premio per il miglior articolo all'ACL. Ho avuto la fortuna di partecipare a una lezione dal vivo in cui ha rivelato: - l'aumento della lunghezza del contesto a 1 milione - questo sarà nel prossimo modello di frontiera Ci sono buone ragioni per credere che DeepSeek V4 utilizzerà NSA.