深度可分离卷积

来源:6-6 深度可分离卷积网络

紫梦沁香

2021-08-24

这两张图貌似矛盾了,第一张是先1×1的卷积核再3×3的卷积核,第二张图先3×3的卷积核而后1×1的卷积核
图片描述
图片描述
而且关于深度可分离的卷积的参数个数我比较在意,这个816怎么来的
无论是按第一张图片来算,32 × 16 + 16(bias) + 9 × 16 + 16(bias) = 688
还是第二章图片,32 × 9 + 32(bias) + 32 × 16 + 16(bias) = 848
都不对,可能是我算错了,虽然这个参数个数的问题无伤大雅,但还是希望老师能解答一下

写回答

1回答

正十七

2021-09-04

参考API文档:https://www.tensorflow.org/api_docs/python/tf/keras/layers/SeparableConv2D


应该是第二种,先做separable convolution,再做1x1卷积。至于参数量,我怀疑是separable convolution没有bias,因为文档中return值的描述是:

A tensor of rank 4 representing activation(separableconv2d(inputs, kernel) + bias).

可以看到,bias是分开加的,只加在separableconv2d后。这里的separableconv2d函数包含分离卷积和1x1卷积两个操作,在separableconv2d里都没有加bias操作。

0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程