Het verrassende aan transformers is hoe belangrijk sparsiteit is voor inferentie en leren, zelfs wanneer je het niet nodig hebt voor efficiëntie.