如何选取降维的维度?

来源:7-5 高维数据映射为低维数据

相声皇后粉丝后援会

2018-04-30

主成分分析可以从最近重构性和最大可分性两个角度来解释,老师所讲的是从最大可分性入手。

如果从最近重构性角度来看,我们可以设置重构阈值,即当我降维之后的数据可以解释或代表原数据的95%时,即认为这个维度是合适的。那么相对应的从最大可分性来看,应该如何选择坐标轴的数量呢?坐标轴的重要性如何区分呢?

写回答

1回答

liuyubobobo

2018-04-30

这两个角度不矛盾。我们每次都使用你所说的“最大可分性”,来求出对于当前数据的一个最主要的成分;而你所说的“最近重构性”,是指多个主成分所占原数据信息的百分比。


你所说的“最大可分性”,不牵扯坐标轴的数量问题,因为每次都是在求对于当前数据的那一个最重要的轴。这个轴就是对于当前数据来说最重要的轴。

0
4
相声皇后粉丝后援会
回复
liuyubobobo
嗯嗯,非常感谢老师的回复
2018-04-30
共4条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5893 学习 · 2454 问题

查看课程