老师,那个请问在python中图片通道信息是如何存储的?

来源:2-5 数据处理与模型图构建(1)

风桐

2018-09-12

我不太理解reshape(3, 32, 32)这边的处理。

写回答

1回答

正十七

2018-09-14

在python版的cifar数据集里,每张图片都是一个长度为3072的一个向量。然后这个向量的前1024个数字是图像的R通道,中间1024个数字是图像的G通道,最后1024个数字是图像的B通道。

所以reshape(3, 32, 32)里的第一步操作就是将这个3072的向量平均分为3份,每份是1024个数字。这样通道就切分出来了

对于每个1024个数字,它包含了图像的一个通道的信息。这里图像的一个通道是32*32的矩阵。展开就是1024个数字。矩阵的展开方法就是将所有行拼接到一起。 比如一个3*3矩阵[[1,2,3],[4,5,6],[7,8,9]],展开就是[1,2,3,4,5,6,7,8,9]。32*32的矩阵的展开方法也是一样的。

所以reshape(3,32,32)的第二步操作就是将每个1024的长度均分成32份,然后再纵向合并,形成一个矩阵。就是[1,2,3,4,5,6,7,8,9]到[[1,2,3],[4,5,6],[7,8,9]]的逆操作。

4
1
风桐
谢谢老师,我知道了!
2018-09-14
共1条回复

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程