Lo sorprendente de los transformadores ha sido cuán importante es la escasez para la inferencia y el aprendizaje, incluso cuando no la necesitas para la eficiencia.