PCA 必须要进行数据处理吗

来源:7-6 scikit-learn中的PCA

慕运维7479159

2018-06-17

PCA 必须要进行数据处理吗?如果不进行归一化处理,PCA 主成分是否会被大的数值占了主要内容,

这里说的归一化 是minMax 将数值转换为 0-1 之间的数值,不知这样处理是否合适

写回答

2回答

liuyubobobo

2018-06-17

PCA必须进行demean处理。


PCA的过程为什么需要demean?因为只有这样,我们这一页最后的式子:

//img.mukewang.com/szimg/5b26108e0001f38d09930557.jpg


才能变成这一页最后的式子:

//img.mukewang.com/szimg/5b26108f00019f5310010561.jpg


换句话说,因为demean的过程,X的均值为0,才能有X project的均值为0。才能有后续一系列我们PCA过程的推导:)


具体为什么X的均值为0以后,X project的均值就为0,我个人认为直观去想应该很容易想到。但如果希望有严格的数学定义,可以参考这个问答:https://coding.imooc.com/learn/questiondetail/43437.html


加油!

1
7
慕九州7392119
我说咋前后两次网页打开不一样。。。。老师效率也太高了,为老师点赞!!!
2019-10-23
共7条回复

慕九州7392119

2019-10-23

//img.mukewang.com/szimg/5daff8d008103da608170128.jpg

就是这里呀,所以说是老师笔误?

0
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程