明明是每一层都采用的相同同的初始化方法,为什么每一层的参数分布会不一样? 比如 5-2 的15分钟处

来源:5-2 激活函数到调参技巧(1)

心不在焉3245945

2019-03-08

写回答

1回答

正十七

2019-03-20

同学您好,5-2的15分钟处显示的不是参数的分布,而是数据经过某一层后得到的激活值的分布。所以虽然参数的分布一样,但由于每一层的输入的分布是不同的,所以每一层的激活值的分布也是不同的。

2
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程