明明是每一层都采用的相同同的初始化方法,为什么每一层的参数分布会不一样? 比如 5-2 的15分钟处
来源:5-2 激活函数到调参技巧(1)
心不在焉3245945
2019-03-08
写回答
1回答
-
正十七
2019-03-20
同学您好,5-2的15分钟处显示的不是参数的分布,而是数据经过某一层后得到的激活值的分布。所以虽然参数的分布一样,但由于每一层的输入的分布是不同的,所以每一层的激活值的分布也是不同的。
20
相似问题
明明是每一层都采用的相同同的初始化方法,为什么每一层的参数分布会不一样? 比如 5-2 的15分钟处
来源:5-2 激活函数到调参技巧(1)
心不在焉3245945
2019-03-08
1回答
正十七
2019-03-20
同学您好,5-2的15分钟处显示的不是参数的分布,而是数据经过某一层后得到的激活值的分布。所以虽然参数的分布一样,但由于每一层的输入的分布是不同的,所以每一层的激活值的分布也是不同的。
相似问题