这里通过交叉验证得到了最佳参数之后为啥还要在对整体的X_train,y_train 做一次fit呢?
来源:8-6 验证数据集与交叉验证

ZJsnowman
2018-10-30
上面通过交叉验证已经得到模型了啊,还有必要再次对整体fit一下吗
写回答
1回答
-
liuyubobobo
2018-10-31
交叉验证没有得到“一个”模型!交叉验证得到的结果是最佳的参数组合和在这组参数组合上计算出的一个分数!
回忆一下,k-fold交叉验证做的事情是:把数据分成k份,分别用k-1份做训练数据,1份作测试数据,我们就能得到k个模型,以及k个模型的分数。将这些模型分数的平均分,作为衡量这组参数的得分。对于不同的参数,我们能得到不同的得分。我们选择得分最高的那组参数,作为我们最终训练模型的参数。
k-fold之后,我们没有得到一个模型。这个过程中,我们针对每一组参数,都训练出了k个模型,用于计算那个分数。这k个模型没有结合所有的数据信息,是一个中间计算过程的产物,不是我们最重要是用的模型!
我们最终,要用交叉验证获得的最佳参数,训练出新的模型!
在你给的截图中,In[7] 就使用交叉验证的得到的参数,创建了新的knn实例;In[8]完成使用这组参数训练出我们最终要使用的模型:)
022018-10-31
相似问题