Bahkan dengan gradien batch penuh, pengoptimal DL menentang teori pengoptimalan klasik, karena mereka beroperasi di *tepi stabilitas.* Dengan @alex_damian_, kami memperkenalkan "aliran pusat": alat teoretis untuk menganalisis dinamika ini yang membuat prediksi kuantitatif yang akurat pada NN riil.