Layer (type) Output Shape Param #

flatten (Flatten) (None, 784) 0

dense (Dense) (None, 100) 78500

dense_1 (Dense) (None, 100) 10100

dense_2 (Dense) (None, 100) 10100

dense_3 (Dense) (None, 100) 10100

dense_4 (Dense) (None, 100) 10100

dense_5 (Dense) (None, 100) 10100

dense_6 (Dense) (None, 100) 10100

dense_7 (Dense) (None, 100) 10100

dense_8 (Dense) (None, 100) 10100

dense_9 (Dense) (None, 100) 10100

dense_10 (Dense) (None, 100) 10100

dense_11 (Dense) (None, 100) 10100

dense_12 (Dense) (None, 100) 10100

dense_13 (Dense) (None, 100) 10100

dense_14 (Dense) (None, 100) 10100

dense_15 (Dense) (None, 100) 10100

dense_16 (Dense) (None, 100) 10100

dense_17 (Dense) (None, 100) 10100

dense_18 (Dense) (None, 100) 10100

dense_19 (Dense) (None, 100) 10100

alpha_dropout (AlphaDropout (None, 100) 0
)

dense_20 (Dense) (None, 10) 1010

=================================================================
Total params: 271,410
Trainable params: 271,410
Non-trainable params: 0

写回答

1回答

正十七

2022-07-07

已采纳

可以每层都接dropout，这里只是展示了一种使用的方法。一般来说，如果dropout层较多，有可能会导致模型难训练，所以如果你每层都加dropout，dropout rate不要设的太大。

你可以试试每层都加，看看效果如何。

慕粉2125289011

非常感谢！

2022-07-10

共1条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程

相似问题

请问老师，为什么dropout后参数不变？

回答 1

运行遍历代码，10次结果都一样，出结果前还会跳出警告

回答 3

这里维度彻底懵了

回答 1

激活函数放在 bn 之前和之后有什么区别？

回答 1

为什么普通的dropout激活值的分布发生了变化，而alpha不会这样？

回答 1

打开慕课网App查看更多内容