模型过拟合验证数据集

来源:8-6 验证数据集与交叉验证

weixin_慕村8280326

2021-09-16

老师将数据集分成三份这样的做法主要问题是不是,验证数据集中可能会有极端数据,可能模型已经拟合好了,但是因为极端数据而误判,导致重新修改参数训练模型,所以之后改进的就是用交叉验证,采用多个测试的数据集

写回答

1回答

liuyubobobo

2021-09-17

我不确定你说的“三份”是指什么?


如果是指 k-fold 的交叉验证,其中 k = 3,是的,这个目的是为了防止极端数据。

但如果是指分成训练-验证-测试数据集三部分,而不是训练-测试数据集两部分,这是为了防止我们每次都根据测试数据集的结果调参,最终调出的模型对测试数据集过拟合。


继续加油!:)

0
3
weixin_慕村8280326
回复
liuyubobobo
谢谢老师!
2021-09-17
共3条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程