为什么Dense(100)后的BatchNormolization是400个参数?

来源:2-10 实战批归一化、激活函数、dropout

OliverSong

2019-06-22

不应该是100*2, 也就是gamma和beta,对应参数scale/offset?

写回答

1回答

正十七

2019-06-27

除了scale和offset之外,还有一组参数scale1和offset1,它们用来恢复数据的表达能力。可以参考https://zhuanlan.zhihu.com/p/34879333

1
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程