Adam校准以加速训练这里能否稍微详细说明一下,谢谢!
来源:5-1 adagrad_adam
Sean_007
2020-07-05
如题,first_unbias和second_unbias在这里是如何起到加速训练作用的?
写回答
1回答
-
正十七
2020-07-07
不知道你说的first_unbias和second_unbias是不是我理解的bata_1和beta_2, 在这里,Adam是Momentum和RMSProp的结合体,beta_1用来做momentum,动量会加速训练这点我们课上讲过了。
beta_2用来做梯度的归一化,即用累积的梯度平方和去对梯度做归一化,使得更新频繁的变量更新的小一点,而更新不频繁的变量更新的多一些。加速训练主要体现在后者,更新的不频繁的变量更新大一些来进行加速。
https://zhuanlan.zhihu.com/p/32626442
012020-07-07
相似问题