O gradiente descendente é uma ferramenta poderosa para otimizar espaços que verificam a hipótese do manifold, mas o espaço de raciocínio é discreto e combinatório. O GD falha em paisagens semelhantes a penhascos onde uma única mudança discreta (um passo lógico) altera todo o resultado. A menos que...???