老师问下如果实际给你一些数据怎么算PCA呢
来源:7-3 求数据的主成分PCA

SomnusL
2020-02-04
就像第二三四题
写回答
1回答
-
liuyubobobo
2020-02-04
主成分分析的数学求解方法这个课程不涉及。因为背后需要的数学基础太多了,这个课程作为机器学习的入门课程,不希望用太多太复杂的数学把同学们吓跑。实际上,通常 PCA 背后的数学原理,在本科也不会学习,一般在研究生学习。(极少数的学校可能会在本科涉猎)
可以参考这里:http://coding.imooc.com/learn/questiondetail/75739.html
对任意数据矩阵使用 PCA 求解的整体过程是:
1)求解原矩阵的协方差矩阵
2)求解协方差矩阵的特征值和特征向量,并将特征向量单位化
3)将特征值从大到小排列,对应的特征向量按列排列,得到的矩阵,就是课程中介绍的 W 矩阵,使用 W 矩阵就可以进行降维了。
4)每一个特征值占总体特征值的比例,就是某一个主成分可以解释原始数据的比例。
步骤是这样的,具体其中的原理,不是在问答区一句话两句话可以解释清楚的了。也不是这个课程的内容了。这个数学原理通常方在研究生学习,其原因也在于需要你了解统计学的知识(协方差),和线性代数的知识(特征值和特征向量),再将他们综合起来运用,才有了 PCA 的数学解。
如果感兴趣,可以再网上搜索自学一下,资料还是挺多的。
一般国外线性代数课本在很靠后的位置,可能也会提及。
继续加油!:)
022020-02-05
相似问题