SGD vs SGD+Momentum——狭长山谷损失面的收敛轨迹

Rosenbrock香蕉函数上的优化路径