train文件夹的n0文件夹内的图片数目也与monkey_labels.txt文件中记录的不符

来源:6-8 Kaggle平台与10monkeys数据集介绍

战战的坚果

2020-05-06

1、老师,在本小节中,我下载了10Monkeys数据集后发现,在train文件夹的n0文件夹内只有105张图片,同样train文件夹的n1,n2文件夹内的图片数目也与monkey_labels.txt文件中记录的不符,但是验证集的数量是符合的。这是怎么回事呢?

Label Latin Name Common Name \n0 n0 alouatta_palliata mantled_howler
1 n1 erythrocebus_patas patas_monkey
2 n2 cacajao_calvus bald_uakari
3 n3 macaca_fuscata japanese_macaque
4 n4 cebuella_pygmea pygmy_marmoset
5 n5 cebus_capucinus white_headed_capuchin
6 n6 mico_argentatus silvery_marmoset
7 n7 saimiri_sciureus common_squirrel_monkey
8 n8 aotus_nigriceps black_headed_night_monkey
9 n9 trachypithecus_johnii nilgiri_langur

Train Images    Validation Images  

0 131 26
1 139 28
2 137 27
3 152 30
4 131 26
5 141 28
6 132 26
7 142 28
8 133 27
9 132 26

2、老师,在10Monkeys数据集中,比如说train文件夹下的n0子文件夹,里面的图片的类别都是alouatta_palliata(参考上面的monkey_labels.txt文件) 吗?,然后n1文件夹里的图片类别都是erythrocebus_patas,以此类推,是这样吗?,那验证集中也是按这种文件格式组织的,它的n0,n1.。。。。。。这些子文件夹中图片的类别也是有这种对应关系的吗?
如果要对它进行测试,该怎么测试呢,它的测试集应是什么样子的呢?(1)仿照cifar10,我猜测会不会是给定像验证集那样的很多子文件数据,然后预测它们的文件夹名?例如n00,n11,n22,n99分别是文件夹,然后文件夹中都放得是相同类别的图片,我们的目的是预测每一个子文件夹的文件名吗?,最后可以利用monkey_labels.txt文件找到它真正的类别名。(2)给定许多各个类别的单个图片(即:一个大的文件夹),然后对单个图片分别进行预测,如果是这种情况的话,我就不知道该怎么做了。
总:不知道我有没有说清楚我的疑问,如果有不清楚的地方,老师提出来后,我再补充吧

写回答

1回答

正十七

2020-05-07

  1. 跟我们代码中的结果不符合可能是kaggle上数据有更新吧。

  2. 数据集中的图片的类别是对应文件夹的名称,这点我们课上讲过了。验证集也是如此。测试集的话一般不会有现成的label,测试集的样子就是一堆图片。然后你要做的就得是写一个新的generator去处理这些图片,我们用的是train_datagen.flow_from_directory所以它才会按照文件夹去读取。而如果没有这些文件夹呢,你有两种做法,第一是去生成一个新的generator,这个generator不按照文件夹读入数据。第二是把模型应该可以直接输入tensor,你可以把图片转成tensor直接输入,不过需要你手工的去做generator预处理的事情,包括值的缩放,图片裁剪等。

0
1
战战的坚果
非常感谢!
2020-05-07
共1条回复

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程