如何判断PCA过拟合呢?

来源:7-6 scikit-learn中的PCA

weixin_慕数据9110392

2021-09-13

老师您好,

在用sklearn进行PCA拟合时,有几个问题没有搞清楚,想问一下:

1、如何计算决定系数R2呢?
2、在sklearn的官方文档还有个PCA的参数是socre,这个score也是评价模型参数的吗?
3、需要用什么方法判断PCA是否过拟合呢?

非常感谢老师!

写回答

1回答

liuyubobobo

2021-09-13

你理解错了一个很重要的概念。PCA 的作用不是拟合。PCA 既不能解决回归问题,也不能解决分类问题。PCA 的作用是降维。使用 PCA,可以将一个 m*n 的数据,在尽量少地丢失信息的情况下,转换成 m*k 的数据(k < n)。当维度降低以后,再使用回归算法或者分类算法,可以更容易地得到更好的结果(因为降低了维度,避免了维度灾难。)


所以:

1)因为 PCA 不适用于解决回归问题的,所以 PCA 算法没有 R^2 这个指标;

3)同理,因为 PCA 根本不是一个回归算法或者分类算法,它没有过拟合的概念;


2) sklearn 的 PCA 的 score 参数,是在将 PCA 作为 概率 PCA 模型(PPCA)使用的时候,才有意义的一个参数。PPCA 是一个比较高级的概念,这个课程不涉及,所以,在这个课程讲解的范围内,我们不会使用 score 的。如果对 PPCA 感兴趣,可以在互联网上搜索“概率 PCA”或者“PPCA”来了解学习更多相关的内容。


继续加油!:)  

3
1
weixin_慕数据9110392
非常感谢老师!
2021-09-14
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程