PCA关于fit的一些疑问
来源:7-6 scikit-learn中的PCA
Amberzy
2019-12-02
老师,请问这个fit的过程不涉及对数据预测,主要用于降维为什么不用X的全集进行,这样得到的结果不是更好吗?
写回答
1回答
-
如果仅仅是对现有数据降维,可以直接用整个 X 进行,没有问题。
但关键是,在机器学习算法中,降维是机器学习算法的前序步骤,所以,和其他机器学习算法一样,存在一个问题:我们需要测试算法的结果。为了测试算法的结果,我们必须模拟没有遇到的数据。测试数据集的意义就在这里。所以,我们在训练的时候,不能动测试数据集。因为测试数据集,是在模拟,我们在实际应用的时候,看不到,未知的数据集。这些数据信息,是不能包含在训练过程中的。
继续加油!:)
012019-12-03
相似问题