关于tf.layers.conv2d(...)输入的张量每一维代表的含义

来源:3-4 卷积神经网络实战

Genpeng

2019-03-31

老师:
您好!
我查了一下TensorFlow的API,对于 tf.layers.conv2d(...) 函数,其输入的张量每一维的含义如下:

The ordering of the dimensions in the inputs. channels_last corresponds to inputs with shape (batch, height, width, channels) .

其中 channels_last 是默认的数据格式。
但是您在课上讲的时候,对于输入张量每一维的含义是这样的:
[None, image_width, image_height, channel]

所以学生想问问,是否老师课上讲的有误?

写回答

1回答

正十七

2019-04-09

同学你好,你贴出来的描述中的定义和我课上所讲的定义的区别在于height 和width的位置,可能是我描述的反了,但对于图像来说,你可以随意的认为哪边是高,哪边是宽,所以高和宽的索引位置是无所谓的。

0
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程