Grid search中有不理解的地方

来源:4-6 网格搜索与k近邻算法中更多超参数

rabbit999

2022-06-14

图片描述
老师你好,关于Grid search为什么通过fit()喂了训练集之后就会得到最佳效率输出呢,一般不是只有fit之后通过测试集才会有效率输出吗?这里有点不理解,上一节的网格搜索的最佳超参数也是通过测试集产出的呀

写回答

1回答

liuyubobobo

2022-06-15

很好的问题。


简单来说,grid_search 内部有一套“测试机制”。grid_search 内部是针对每一套参数,都进行了训练,然后在内部,就是用另一套测试机制,测试出了这套参数的好坏,然后 grid_search 返回的是根据这套测试机制,得到的最好的测试结果对应的参数。


这套测试机制是什么?叫做 Cross Validation(交叉验证),这就是 grid search 所对应的类 GridSearchCV 中 CV 两个字母的意思。(Cross Validation 的首字母。)


具体交叉验证的机制是怎样的?这个课程的后续会具体介绍的。可以在课程后续学习了交叉验证以后,再回过头来想一下这个问题:)


继续加油!:)

2
2
liuyubobobo
回复
rabbit999
对。但不是将整个传进去的 X_train 作为测试集,而是分割出一部分。(具体 CV 的逻辑比这句话要复杂一些:))
2022-06-15
共2条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程