勾配降下は多様体仮説を検証する最適化空間に強力なツールですが、推論空間は離散的かつ組合せ的です。 GDは、たった一つの離散的な変化(論理的なステップ)で結果全体が変わる崖のような地形では失敗します。 ただし...???