El ex autor de DeepSeek de Native Sparse Attention ganó el premio al mejor artículo de ACL. Tuve la suerte de asistir a una conferencia en vivo donde reveló: - Ampliación de la longitud del contexto a 1 millón - Esto estará en el próximo modelo de Frontier Hay buenas razones para creer que DeepSeek V4 usará NSA.