Фахівці з глибокого навчання схильні вважати, що коли градієнти (1-й порядок) застрягають, то викривлення (2-й порядок/гессен) — це точно відповідь. Цілком можливо, що кращий хід — у протилежному напрямку: методи 0-го порядку.