深度可分离卷积
来源:6-6 深度可分离卷积网络
紫梦沁香
2021-08-24
这两张图貌似矛盾了,第一张是先1×1的卷积核再3×3的卷积核,第二张图先3×3的卷积核而后1×1的卷积核
而且关于深度可分离的卷积的参数个数我比较在意,这个816怎么来的
无论是按第一张图片来算,32 × 16 + 16(bias) + 9 × 16 + 16(bias) = 688
还是第二章图片,32 × 9 + 32(bias) + 32 × 16 + 16(bias) = 848
都不对,可能是我算错了,虽然这个参数个数的问题无伤大雅,但还是希望老师能解答一下
写回答
1回答
-
正十七
2021-09-04
参考API文档:https://www.tensorflow.org/api_docs/python/tf/keras/layers/SeparableConv2D
应该是第二种,先做separable convolution,再做1x1卷积。至于参数量,我怀疑是separable convolution没有bias,因为文档中return值的描述是:
A tensor of rank 4 representing
activation(separableconv2d(inputs, kernel) + bias)
.可以看到,bias是分开加的,只加在separableconv2d后。这里的separableconv2d函数包含分离卷积和1x1卷积两个操作,在separableconv2d里都没有加bias操作。
00
相似问题