老师, 还是不太懂动量梯度下降的意思, 能简单举例说明下吗

来源:3-1 神经网络进阶

请问9890202

2018-11-15

公式不太理解,能再详细说明下吗

写回答

1回答

正十七

2018-11-25

一言以蔽之,就是把之前的梯度存储起来,用一定的权重加权加到当前的梯度上去。

用课程的代码进行表示,一步一步讲解就是:

vx = 0 # 这个是之前保存的梯度
while True:
    dx = compute_gradient(x) # 计算出来当下的梯度
    
    “”“
    等号右边的vx是上一步保存的梯度,rho是权重。等式的含义就是将上一步保存的梯度加权并且加
    上当下的梯度,就是这一步要更新的梯度,同时也是下一步的“上一步保存的梯度”。
    ”“”
    vx = rho * vx + dx
    x += learning_rate * vx # 更新参数


1
1
Liny77
老师,rho是个固定的值吗,还是需要另行计算,rhio是怎么计算的,是跟增强学习ada boosting一样没有被学习到的数据让它权值增大,还是其他的?
2019-03-25
共1条回复

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程