vggnet中 经过maxpool 后输出通道加倍是怎么得到的?
来源:4-2 卷积神经网络进阶(Vggnet-Resnet)
xiabai84
2018-09-18
比如如果我maxpool size = [2,2], strides=2 那输出不就变输入的一半了吗?
上课没听懂这部分。 而且通道这个概念不是很清楚。最开始讲的是RGB, 但后来的channel和这个RGB 好像就没什么联系了。 老师可不可以解释下这部分?
写回答
1回答
-
小义6626
2018-09-18
通道加倍不是池化操作之后,而是卷积之后。rgb三个通道,是用[height,width,3]的卷积核去做卷积操作,那个3是指的卷积核的厚度,所以卷积不是在单个通道上,而是3个通道一起。我希望下一层有多少个feature map(特征映射,或者说希望下一次得到多少个通道),我就用几个不同的卷积核去做卷积。一般操作是卷积后的通道数翻倍。比如,你这一次得到64个通道的结果,就是用64个卷积核得到64个feature map。下一次做卷积操作时,你希望通道数翻倍,就是得到128个特征图。这时,你用128个大小为[height, width, 64]的不同卷积核去做卷积。为什么是三个维度的卷积核,因为你上一次得到的是64个feature map,要对这64个通道做卷积,你需要使用厚度为64的卷积核。
你可能认为卷积是在不同通道上做,以前好像是有这种操作的,但现在的卷积,每次做卷积不是在单个通道上做,而是在所有通道上一起。用一个和通道数相同厚度的卷积核,一次卷积所有通道!30
相似问题