关于截距的问题

来源:8-2 scikit-learn中的多项式回归与Pipeline

NTeam6

2021-03-15

在多元线性回归中,系数coef_和interception_好像是分开的,默认把向量theta的第一列作为interception_,除第一列以外的作为coef_。
但是在这一节多项式回归中,coef_的第一列好像始终为0,是不是因为在添加多项式项的时候多添加了一列恒为1的特征,为了把这列特征消掉所以coef_的第一列是始终为0,但是interception_却又不为0,这不是多此一举吗?添加多项式项的时候添加一列恒为1的项是不是没有必要?

写回答

1回答

liuyubobobo

2021-03-16

是的,从做多元线性回归的角度,多项式特征有一列全为 1 没有必要。


但是,我们的多项式特征是通过 PolynomialFeatures 这个类得到的,这个类不知道你后续要做的是多元线性回归。这个类的任务就是把你的特征转换成多项式特征。而 1 是一个多项式特征,即所有项的次数取 0。


同时,多这一列,并不会影响线性回归的结果,所以我们也不需要费力把这一个在多项式特征看来没用的特征扔掉:)


继续加油!:)

0
1
NTeam6
非常感谢!
2021-03-16
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程