什么样的数据适合使用pca降维

来源:7-5 高维数据映射为低维数据

追梦逐梦白日做梦

2018-10-02

什么样的数据适合pca降维,什么样的数据不适合?最近在学习autoEncoder,什么样的数据又适合这种非线性的降维呢?

写回答

1回答

liuyubobobo

2018-10-02

PCA最大的假设是线性!PCA的过程是在n维空间中,经过线性变换,找到其低维的子空间。这里的关键词是线性。如果你的线性代数足够好,可以再仔细理解一下PCA的数学解:)


以二维空间为例,如果进行降维,PCA只能找到直线的子空间;以三维空间为例,如果进行降维,PCA只能找到平面的子空间(二维)或者直线的子空间(一维)。如果你的数据分布在一个低维的非线性空间中,PCA是找不到的,此时,就需要非线性降维算法了:)

1
3
liuyubobobo
同理,z = x + y是线性的;z = x^2 + y^2 是非线性的。都是二维空间(只有两个特征)。前者是平面,后者是曲面。
2018-10-02
共3条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5850 学习 · 2437 问题

查看课程