请问老师在KNN手写数字识别里为什么归一化以后正确率反而降低了

来源:

SpiceeYJ

2018-10-04

归一化之前正确率稳定在98.6左右
归一化以后降低到了97.2左右 这是为什么啊

写回答

1回答

liuyubobobo

2018-10-04

这是正常的。


首先请确定你两次试验的训练数据集和测试数据集是完全相同的,即没有因为随机的因素引入的差距。


在这个基础上,即使得到这样的结果也是正常的。因为:

1)准确率只能描述当前测试数据的结果,或者严格地说,对于当前的(训练数据和测试)数据,归一化以后,准确率从98.6降到了97.2。但这不代表,对于新的数据,准确率会怎样。

2)如果你的一切操作是正确的。我倾向于相信97.2,因为对于kNN来说,进行归一化比不进行归一化更合理,结果更可靠。


对于当前数据,最准确的获得准确率的方式,是遍历所有随机分配训练数据集合测试数据集的可能,取所有可能的准确率的均值。但我们通常不会这么做。因为太麻烦了。这也告诉我们,我们通常拿到的准确率只是一个“指标”,他只是给我们一个概念,而不是一个精准的数字。


一定要明确:机器学习的过程不是物理公式的计算,而是基于统计学的。统计就有误差,就和统计样本有关,所有的结果都是值得怀疑的:)

0
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程