模型过拟合验证数据集
来源:8-6 验证数据集与交叉验证

weixin_慕村8280326
2021-09-16
老师将数据集分成三份这样的做法主要问题是不是,验证数据集中可能会有极端数据,可能模型已经拟合好了,但是因为极端数据而误判,导致重新修改参数训练模型,所以之后改进的就是用交叉验证,采用多个测试的数据集
写回答
1回答
-
liuyubobobo
2021-09-17
我不确定你说的“三份”是指什么?
如果是指 k-fold 的交叉验证,其中 k = 3,是的,这个目的是为了防止极端数据。
但如果是指分成训练-验证-测试数据集三部分,而不是训练-测试数据集两部分,这是为了防止我们每次都根据测试数据集的结果调参,最终调出的模型对测试数据集过拟合。
继续加油!:)
032021-09-17
相似问题