图像问题

来源:2-5 数据处理与模型图构建(1)

亨heng

2021-11-14

老师我在理解您视频里这两行代码的时候

image_arr = image_arr.reshape((3, 32, 32)) 

image_arr = image_arr.transpose((1, 2, 0))

去查了一下这两个方法的解释,我看到的一种说法是reshape方法会把这个长度为3072的向量分成3个矩阵,每个矩阵是32*32的,每个矩阵代表一个通道信息,那下面这个transpose((1, 2, 0))就有些理解混乱了😔,把3*32*32的形式转化为32*32*3的形式,那不就是32个矩阵 每个矩阵是32*3的吗?(感觉是错误的),那如果是这样的那么每个矩阵代表什么意义?我看到老师您在视频里说这个处理是通道交换吗。。这个通道交换的概念不是很能理解

辛苦老师解答下我的疑惑呗😉

写回答

1回答

正十七

2021-12-07

同学你好,你的理解都是对的。

reshape后的矩阵shape为32x32x3。可以理解成32个32x3的矩阵,但可以换个角度,那就是32x32的矩阵,每个元素的值都是三个值,代表的是rgb。所以这个reshape相当于把每个通道的对应位置的值聚到一起。原来是3个32x32,每个32x32是一个通道的所有值,现在是一个32x32,包括了三个通道的值。

0
0

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程