vggnet中 经过maxpool 后输出通道加倍是怎么得到的?

来源:4-2 卷积神经网络进阶(Vggnet-Resnet)

xiabai84

2018-09-18

比如如果我maxpool size = [2,2], strides=2 那输出不就变输入的一半了吗?
上课没听懂这部分。 而且通道这个概念不是很清楚。最开始讲的是RGB, 但后来的channel和这个RGB 好像就没什么联系了。 老师可不可以解释下这部分?

写回答

1回答

小义6626

2018-09-18

通道加倍不是池化操作之后,而是卷积之后。rgb三个通道,是用[height,width,3]的卷积核去做卷积操作,那个3是指的卷积核的厚度,所以卷积不是在单个通道上,而是3个通道一起。我希望下一层有多少个feature map(特征映射,或者说希望下一次得到多少个通道),我就用几个不同的卷积核去做卷积。一般操作是卷积后的通道数翻倍。比如,你这一次得到64个通道的结果,就是用64个卷积核得到64个feature map。下一次做卷积操作时,你希望通道数翻倍,就是得到128个特征图。这时,你用128个大小为[height, width, 64]的不同卷积核去做卷积。为什么是三个维度的卷积核,因为你上一次得到的是64个feature map,要对这64个通道做卷积,你需要使用厚度为64的卷积核。
你可能认为卷积是在不同通道上做,以前好像是有这种操作的,但现在的卷积,每次做卷积不是在单个通道上做,而是在所有通道上一起。用一个和通道数相同厚度的卷积核,一次卷积所有通道!

3
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程