关于Grid Search处理knn中超参数的问题

来源:4-6 网格搜索与k近邻算法中更多超参数

慕丝3514060

2018-10-20

用knn处理一个样本数为15的样本数据,其中我将test_size设置为0.2,即12条数据用于train,3条数据用于test。
使用Grid Search来寻找最优的超参数时,输入 ‘n_neighbors’: [i for i in range(1, 11)]‘,按实际情况来说并没有超出样本数量,但是程序报错,显示以下提示:
ValueError: Expected n_neighbors <= n_samples, but n_samples = 8, n_neighbors = 9
想知道报错的具体原因,是否因为grid search自身会分割训练数据集和测试数据集。

写回答

1回答

liuyubobobo

2018-10-20

是的。因为GridSearch本身使用的是交叉验证的方式,而非简单的训练,测试数据集划分的方式,来验证算法的性能:)


具体交叉验证的机制,会在第八章进行介绍:)


加油!:)

0
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程