用RandomizedSearchCV,在训练集和验证集上的loss比较小,但在测试集上的loss比较大。什么原因造成这种情况,如果减低测试集上的loss?
来源:2-18 实战sklearn超参数搜索

weixin_慕桂英9448972
2021-03-24
第一个问题:就是使用随机搜索RandomizedSearchCV方法,在训练集和验证集上的loss比较小,但在测试集上的loss比较大。什么原因造成这种情况,如果减低测试集上的loss?
训练集和验证集上的loss
测试集上的loss
第二个问题:我获取预测值的方法是否正确?
写回答
1回答
-
正十七
2021-04-05
第一个问题:你的数据集看起来比较小,比我们在demo中展示的数据集还小,所以原因估计是过拟合。可以考虑增大数据集或者做一些data augmentation来解决。
第二个问题:你的方法是对的。
00
相似问题