Anche con gradienti a batch completi, gli ottimizzatori DL sfidano la teoria classica dell'ottimizzazione, poiché operano al *limite della stabilità.* Con @alex_damian_, introduciamo i "flussi centrali": uno strumento teorico per analizzare queste dinamiche che fa previsioni quantitative accurate su reti neurali reali.