为什么测试数据集的准确度高于训练数据集?

来源:9-5 决策边界

神经旷野舞者

2018-03-14

log_reg.score(X_test, y_test) 是 1.0

log_reg.score(X_train, y_train) 是 0.98

感觉模型是根据训练数据集训练出来的,之前不都是训练数据集百分之百吻合吗,为什么这次训练数据集的准确度反而没有达到1?是不是因为梯度下降法就是只能达到一个最优值,而且这个训练样本本来就不能被一条直线分割?

写回答

1回答

liuyubobobo

2018-03-14

非常对。


在实际问题的解决中,如果遇到这种情况,应该加大数据量,得到的结果更可信:)

1
8
liuyubobobo
回复
神经旷野舞者
组合分析没有错,但是这个组合分析可能不是你想象的1+1=2一样有非常固定的套路。加油!
2018-03-14
共8条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程