La gente del aprendizaje profundo tiende a creer que cuando los gradientes (de primer orden) se estancan, seguramente la curvatura (de segundo orden/Hessian) es la respuesta. Puede que el mejor movimiento esté en la dirección opuesta: métodos de orden cero.