为什么测试数据集的准确度高于训练数据集?
来源:9-5 决策边界

神经旷野舞者
2018-03-14
log_reg.score(X_test, y_test) 是 1.0
log_reg.score(X_train, y_train) 是 0.98
感觉模型是根据训练数据集训练出来的,之前不都是训练数据集百分之百吻合吗,为什么这次训练数据集的准确度反而没有达到1?是不是因为梯度下降法就是只能达到一个最优值,而且这个训练样本本来就不能被一条直线分割?
写回答
1回答
-
非常对。
在实际问题的解决中,如果遇到这种情况,应该加大数据量,得到的结果更可信:)
182018-03-14
相似问题
交叉验证的疑惑
回答 1
平衡数据集对构建模型的影响
回答 2