PCA以及StandardScaler中的fit方法参数有X和y,我看到课程中都是fit(X_train),那后面参数y的作用是什么?
来源:7-6 scikit-learn中的PCA
NLPLearner
2018-07-22
pca = PCA(0.95)
pca.fit(X_train)或者pca.fit(X_train,y_train)的去区别是什么?
写回答
1回答
-
如果只是单独使用StandardScaler或者PCA,参数y完全没有作用。
但是,在很多时候,StandardScaler或者是PCA是Pipeline的一部分。我们在整条Pipeline中需要兼顾进行数据的预处理和最终的算法识别过程,所以我们要将X和y全部传给整条Pipeline。此时,为了兼容pipeline的功能,StandardScaler和PCA也需要能够传进去y。不过在他们的内部,这个y完全没有作用:)
412018-07-23
相似问题