Lo sorprendente de los transformadores ha sido lo importante que es la escasez para la inferencia y el aprendizaje, incluso cuando no la necesita para la eficiencia.