Ex-DeepSeek auteur van Native Sparse Attention won de beste paper award van ACL. Ik had het geluk om een live lezing bij te wonen waar hij onthulde: - het opschalen van de contextlengte naar 1 miljoen - dit zal in het volgende frontier model zijn Er is goede reden om te geloven dat DeepSeek V4 NSA zal gebruiken.