如何判断欠拟合是因为模型选择错误还是超参数选择错误？

来源：8-6 验证数据集与交叉验证

神经旷野舞者

2018-03-06

是不是根据训练数据集的train_score很大，然后调了几次参数还是很大来判断？

写回答

2回答

liuyubobobo

2018-03-07

已采纳

通常，我们只能看出我们的模型到底是欠拟合，还是过拟合。如果是在欠拟合的情况下，到底为什么欠拟合，这个背后的原因需要具体问题具体分析，不能一概而论，很难使用一个固定指标就看出来。学习机器学习算法，其实主要训练的就是这个具体情况具体分析的能力。

另外，在机器学习领域，很难讲模型选择的是正确还是错误。只有合适不合适。而且，合适不合适的界限也是模糊的。不过整体而言，在你的数据“没有问题”的情况下，欠拟合是相对好解决的。不管是什么模型，只要增加模型的复杂度，都一定会表现出“没有欠拟合，而开始过拟合“的“症状”。所以我在课程中说，解决“过拟合”才是机器学习的核心。至于如何解决过拟合，可以参考这里：https://coding.imooc.com/learn/questiondetail/39781.html

另外，一个需要考虑的非常重要的因素是：数据。很多时候，机器学习的结果不够好，可能你的模型选择也没有问题；你的超参数选择也没有问题；但是你的数据有问题。或者数据不够；或者数据不能涵盖所有情况；甚至数据和你要学习的内容根本不相关。在这些情况下，算法是无法补救的。

神经旷野舞者

liuyubobobo

那应该是看具体问题要求的精度吧

2018-03-08

共9条回复