Lucrul surprinzător despre transformatoare a fost cât de importantă este dispersia pentru inferență și învățare, chiar și atunci când nu ai nevoie de ea pentru eficiență.