为什么Dense(100)后的BatchNormolization是400个参数?
来源:2-10 实战批归一化、激活函数、dropout
OliverSong
2019-06-22
不应该是100*2, 也就是gamma和beta,对应参数scale/offset?
写回答
1回答
-
除了scale和offset之外,还有一组参数scale1和offset1,它们用来恢复数据的表达能力。可以参考https://zhuanlan.zhihu.com/p/34879333
10
相似问题