Zelfs met volledige batchgradiënten tarten DL-optimalisatoren de klassieke optimalisatietheorie, aangezien ze opereren aan de *rand van stabiliteit.* Samen met @alex_damian_ introduceren we "centrale stromen": een theoretisch hulpmiddel om deze dynamiek te analyseren dat nauwkeurige kwantitatieve voorspellingen doet over echte NN's.