PCA关于fit的一些疑问

来源:7-6 scikit-learn中的PCA

Amberzy

2019-12-02

图片描述老师,请问这个fit的过程不涉及对数据预测,主要用于降维为什么不用X的全集进行,这样得到的结果不是更好吗?

写回答

1回答

liuyubobobo

2019-12-02

如果仅仅是对现有数据降维,可以直接用整个 X 进行,没有问题。


但关键是,在机器学习算法中,降维是机器学习算法的前序步骤,所以,和其他机器学习算法一样,存在一个问题:我们需要测试算法的结果。为了测试算法的结果,我们必须模拟没有遇到的数据。测试数据集的意义就在这里。所以,我们在训练的时候,不能动测试数据集。因为测试数据集,是在模拟,我们在实际应用的时候,看不到,未知的数据集。这些数据信息,是不能包含在训练过程中的。


继续加油!:)

0
1
Amberzy
非常感谢!
2019-12-03
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程