Det overraskende med transformatorer har vært hvor viktig sparsitet er for slutning og læring, selv når du ikke trenger det for effektivitet.