PCA以及StandardScaler中的fit方法参数有X和y,我看到课程中都是fit(X_train),那后面参数y的作用是什么?

来源:7-6 scikit-learn中的PCA

NLPLearner

2018-07-22

pca = PCA(0.95)
pca.fit(X_train)或者pca.fit(X_train,y_train)的去区别是什么?

写回答

1回答

liuyubobobo

2018-07-23

如果只是单独使用StandardScaler或者PCA,参数y完全没有作用。


但是,在很多时候,StandardScaler或者是PCA是Pipeline的一部分。我们在整条Pipeline中需要兼顾进行数据的预处理和最终的算法识别过程,所以我们要将X和y全部传给整条Pipeline。此时,为了兼容pipeline的功能,StandardScaler和PCA也需要能够传进去y。不过在他们的内部,这个y完全没有作用:)

4
1
NLPLearner
谢谢老师~
2018-07-23
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程