Автор Ex-DeepSeek, Native Sparse Attention, получил награду за лучшую статью на ACL. Мне повезло посетить живую лекцию, где он раскрыл: - увеличение длины контекста до 1 миллиона - это будет в следующей модели фронтира Есть веские основания полагать, что DeepSeek V4 будет использовать NSA.