主成分对应的是某个属性列吗?是的话那具体是那个属性列呢?知道这个主成分了,后续分析应该怎么使用它呢?

来源:4-11 因子分析与实现

shangqhai

2018-05-27

我试着依次把n设为7、6、5、4、3、2、1,分别查看Ratio的结果,结果从7个逐个减少(Ratio的7个值其实是按从大到小给出的,n每减少1个,也就是舍弃了最小的那个值),最后n=1时,只保留了那个最大值0.998。另外我把原表10个字段的顺序打乱后也按上面步骤试了试,Ratio的7个值排序是不变的,一直都是从大到小,也会随着n逐个减少,最后n=1时只留那个最大的。这种情况下,我不太能理解的是,该怎么理解这个主成分的意义,它和属性之间是什么关系(总觉得应该和某个属性能关联上或对应上),现在知道了这个0.998,或者是降维后的矩阵值low_mat该怎么呢?找到主成分后,后续该怎么使用它呢?

//img.mukewang.com/szimg/5b0ab81b00010a4509240281.jpg

写回答

1回答

途索

2018-05-27

同学你好,首先,对你的学习方法表示赞扬,通过自己尝试的方式来学习,才能更好把东西掌握。下面来解释你的问题,主成分分析法是一种变换方法,如果n取7,主成分分析变换后形成的新矩阵,每个新特征分量都是原来特征分量的线性组合(就是原来特征分量加加减减,就可以组成新的特征了,所以,变化顺序后,新特征不变),这些新特征有个特点,就是相互间相关性几乎为0(也就是正交),这就带来个好处,特征间是独立的,我考虑新特征中的一个,就不用考虑其他特征对它的影响。但这些特征可以代表总体样本的比重不太一样,有的大,有的小,主成分分析法,就是去掉这些代表总体样本比重小的特征,保留大部分特征,从而达到降维的目的。至于把比重大的特征放前,比重小的放后,是个约定俗成的习惯,你可以调整。
确定了变换方法,我们就可以把新数据通过此方法进行降维,得到新的正交特征,进行更灵活的处理了。

1
1
shangqhai
非常感谢!
2018-05-28
共1条回复

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程