如何判断PCA过拟合呢?
来源:7-6 scikit-learn中的PCA
weixin_慕数据9110392
2021-09-13
老师您好,
在用sklearn进行PCA拟合时,有几个问题没有搞清楚,想问一下:
1、如何计算决定系数R2呢?
2、在sklearn的官方文档还有个PCA的参数是socre,这个score也是评价模型参数的吗?
3、需要用什么方法判断PCA是否过拟合呢?
非常感谢老师!
写回答
1回答
-
你理解错了一个很重要的概念。PCA 的作用不是拟合。PCA 既不能解决回归问题,也不能解决分类问题。PCA 的作用是降维。使用 PCA,可以将一个 m*n 的数据,在尽量少地丢失信息的情况下,转换成 m*k 的数据(k < n)。当维度降低以后,再使用回归算法或者分类算法,可以更容易地得到更好的结果(因为降低了维度,避免了维度灾难。)
所以:
1)因为 PCA 不适用于解决回归问题的,所以 PCA 算法没有 R^2 这个指标;
3)同理,因为 PCA 根本不是一个回归算法或者分类算法,它没有过拟合的概念;
2) sklearn 的 PCA 的 score 参数,是在将 PCA 作为 概率 PCA 模型(PPCA)使用的时候,才有意义的一个参数。PPCA 是一个比较高级的概念,这个课程不涉及,所以,在这个课程讲解的范围内,我们不会使用 score 的。如果对 PPCA 感兴趣,可以在互联网上搜索“概率 PCA”或者“PPCA”来了解学习更多相关的内容。
继续加油!:)
312021-09-14
相似问题