在多项式回归中用split分割数据集后,再算了score得分
来源:8-6 验证数据集与交叉验证
nyist_dusen
2018-08-02
poly_clf = PolynomialRegression(9)
poly_clf.fit(X_train, y_train)
score = poly_clf.score(X_test, y_test)
score
在多项式回归中用split分割数据集后,再算了score得分,得分为-1.223,想问下老师-1.223的话,是指的偏差为-0.22?(和-1对比),还是指的偏差为-2.22?(和1对比)
写回答
2回答
-
nyist_dusen
提问者
2018-08-03
多谢波波老师~
00 -
liuyubobobo
2018-08-03
对于回归问题,默认的score返回的是R square的结果。(回忆5-6的内容)。Rsquare为1,代表预测完全准确。R square为0,代表预测水平和只预测平均值是一个水平。通常R square的值应该在0-1之间,越高越好,这个模型才有可取之处。R square为负数,代表预测水平还不如只预测平均值。说明你得到的模型非常差。此时需要考虑:
1)看看在训练集上score,如果非常高,说明过拟合了。你在多项式回归中传入的degree为9,高概率过拟合;
2)数据中是否有非常影响结果的outlier;
3)这个模型是否本身不适合你的数据,需要换其他模型。
加油!
032018-08-03
相似问题