老师,那个请问在python中图片通道信息是如何存储的?
来源:2-5 数据处理与模型图构建(1)
风桐
2018-09-12
我不太理解reshape(3, 32, 32)这边的处理。
写回答
1回答
-
在python版的cifar数据集里,每张图片都是一个长度为3072的一个向量。然后这个向量的前1024个数字是图像的R通道,中间1024个数字是图像的G通道,最后1024个数字是图像的B通道。
所以reshape(3, 32, 32)里的第一步操作就是将这个3072的向量平均分为3份,每份是1024个数字。这样通道就切分出来了
对于每个1024个数字,它包含了图像的一个通道的信息。这里图像的一个通道是32*32的矩阵。展开就是1024个数字。矩阵的展开方法就是将所有行拼接到一起。 比如一个3*3矩阵[[1,2,3],[4,5,6],[7,8,9]],展开就是[1,2,3,4,5,6,7,8,9]。32*32的矩阵的展开方法也是一样的。
所以reshape(3,32,32)的第二步操作就是将每个1024的长度均分成32份,然后再纵向合并,形成一个矩阵。就是[1,2,3,4,5,6,7,8,9]到[[1,2,3],[4,5,6],[7,8,9]]的逆操作。
412018-09-14
相似问题