如何选取降维的维度?
来源:7-5 高维数据映射为低维数据

相声皇后粉丝后援会
2018-04-30
主成分分析可以从最近重构性和最大可分性两个角度来解释,老师所讲的是从最大可分性入手。
如果从最近重构性角度来看,我们可以设置重构阈值,即当我降维之后的数据可以解释或代表原数据的95%时,即认为这个维度是合适的。那么相对应的从最大可分性来看,应该如何选择坐标轴的数量呢?坐标轴的重要性如何区分呢?
写回答
1回答
-
这两个角度不矛盾。我们每次都使用你所说的“最大可分性”,来求出对于当前数据的一个最主要的成分;而你所说的“最近重构性”,是指多个主成分所占原数据信息的百分比。
你所说的“最大可分性”,不牵扯坐标轴的数量问题,因为每次都是在求对于当前数据的那一个最重要的轴。这个轴就是对于当前数据来说最重要的轴。
042018-04-30
相似问题