关于很大的梯度流过
来源:5-2 激活函数到调参技巧(1)
Jerry_Lnj
2019-09-04
看了老师您回答一个同学的相同问题,还是没懂,什么叫很大的梯度流过神经元,能用比较简单的带数字例子进行解释吗?
写回答
1回答
-
正十七
2019-10-01
”很大的梯度流过神经元" 的意思就是指 该神经元相关的参数被梯度下降算法更新了一次。
比如原来的参数可能是:[-10, 5, 7], 然后突然来了一个梯度是[-100, -100, -100], 这样参数就更新成了 [-110, -95, -93]。 然后如果接下来的收到的数据都是[a, b, c], 其中a, b, c >=0, 这个时候神经元的输出恒为0,于是不会再有梯度传回来。因而参数得不到更新,也就变成了dead cell了。
122020-05-07
相似问题