Det överraskande med transformatorer har varit hur viktig gleshet är för inferens och inlärning, även när du inte behöver den för effektiviteten.