图像预处理的疑惑

来源:10-9 机器+深度学习实现少样本苹果分类(一)

Quicklock

2020-04-04

flare老师,您好!我在看卷积神经网络,您在使用VGG16提取图像主要特征时候,说VGG16的输入图像大小必须要224224才能提取出特征,我就是有点好奇,为什么一定要变成224224,如果我变成256256大小难度就会比224224的结果要差吗?还是说224*224是研究者们尝试了好多次之后得出的最佳输入到VGG16的图像大小呢?希望Flare能解答一下我的小疑惑,万分感谢!

写回答

2回答

flare_zhao

2022-03-12

这是别人提前写好的结构,设置了输入数据的格式要求,具体可以看下论文

0
0

flare_zhao

2020-04-04

同学你好,不是这个意思,这里指定输入尺寸的原因在于,VGG16模型是已经结构设计好了的模型,这也意味着对输入的数据是有格式要求的。如果你输入的数据维度不对,那就无法正常计算导致报错。如果你的数据源是1000*1000的图片,那就需要先转化为224*224,不转化会报错,你可以尝试一下。并不是说结果会变差,而是数据格式的要求。

0
1
qq_慕勒2217182
那原来的1000的像素一下子成224了,会不会降低准确率啊
2022-03-08
共1条回复

Python3入门人工智能 掌握机器学习+深度学习

人工智能基础全方位讲解,构建完整人工智能知识体系,带你入门AI

1946 学习 · 594 问题

查看课程