降维后k个主成分在业务上的意义是什么?
来源:7-11 人脸识别与特征脸
chanchan666
2020-02-04
老师,你在PCA这一章举的例子让我叹为观止,有一种开拓新大陆的赶脚~原来学习也可以这么开心~既有算法原理,又有可视化分析,真的太牛逼了。
我还有一个问题,PCA的本质是坐标系转换,把原来n维的坐标系降低且映射到k维坐标系,那么原来的n个特征,分别有特征名称,降到k个特征后,这k个特征的名称是什么呢?我觉得知道这k个特征分别代表的什么是很有意义的。就像特征脸一样,最重要的主成分是脸的轮廓,对业务的理解是有意义的。但如果特征不是像图像这种,无法做可视化分析,那我们应该怎么理解这k个纬度在业务上意义呢?
1回答
-
答案是,没有意义。PCA 之后得到的每一个维度,只不过是原有维度的集合。可以参考这里:https://coding.imooc.com/learn/questiondetail/136253.html
比如原有的数据,一个维度是房间面积,另一个维度是房间所在的楼层。那么PCA之后得到的一个维度,只不过可能是 (0.9 * 房间面积, 0.1 * 所在楼层) 而已,他没有业务意义,也没有特征名称。
在个别领域,看似是有意义的,比如你说的“特征脸”,但这是领域相关的,不是 PCA 自带的性质。这些领域相关的意义,是人为定义的,比如“特征脸”这个词。特征脸之所以能可视化,因为他处理的就是图像领域的问题。是因为他本身处理的就是图像数据,所以我们可以将它很好地直观表达出来;而不是反过来,所有的数据都可以很好地直观表达出来,我只挑了特征脸。
当然,不同领域的数据都可以表达,这就是数据可视化这个领域的意义,已经和 PCA 无关了。
PCA 本质就是做数据压缩,而不是进一步的数据解读或者数据挖掘。实际上,PCA 最大的问题,就是丢掉了原有的数据语义。
可以再参考这里:https://coding.imooc.com/learn/questiondetail/40921.html
继续加油!:)
00
相似问题