Le persone che si occupano di deep learning tendono a credere che quando i gradienti (1° ordine) si bloccano, sicuramente la curvatura (2° ordine/Hessian) sia la risposta. Potrebbe invece essere che la mossa migliore sia nella direzione opposta: metodi di 0° ordine.