每层初始化后,梯度是如何计算出来的
来源:5-2 激活函数到调参技巧(1)
慕无忌3122985
2018-08-28
视频15:56秒左右,有一个tanh,用均值0,方差0.02的正太分布初始化,可以看到高层的梯度都集中在0,这些高层的梯度是如何计算出来的呢?
写回答
1回答
-
梯度都是使用反向传播计算出来的。在这个过程中,需要输入一些样本进行梯度的计算。
112018-08-31
相似问题
每层初始化后,梯度是如何计算出来的
来源:5-2 激活函数到调参技巧(1)
慕无忌3122985
2018-08-28
视频15:56秒左右,有一个tanh,用均值0,方差0.02的正太分布初始化,可以看到高层的梯度都集中在0,这些高层的梯度是如何计算出来的呢?
1回答
梯度都是使用反向传播计算出来的。在这个过程中,需要输入一些样本进行梯度的计算。
相似问题