降维后k个主成分在业务上的意义是什么?

来源:7-11 人脸识别与特征脸

chanchan666

2020-02-04

老师,你在PCA这一章举的例子让我叹为观止,有一种开拓新大陆的赶脚~原来学习也可以这么开心~既有算法原理,又有可视化分析,真的太牛逼了。

我还有一个问题,PCA的本质是坐标系转换,把原来n维的坐标系降低且映射到k维坐标系,那么原来的n个特征,分别有特征名称,降到k个特征后,这k个特征的名称是什么呢?我觉得知道这k个特征分别代表的什么是很有意义的。就像特征脸一样,最重要的主成分是脸的轮廓,对业务的理解是有意义的。但如果特征不是像图像这种,无法做可视化分析,那我们应该怎么理解这k个纬度在业务上意义呢?

写回答

1回答

liuyubobobo

2020-02-04

答案是,没有意义。PCA 之后得到的每一个维度,只不过是原有维度的集合。可以参考这里:https://coding.imooc.com/learn/questiondetail/136253.html


比如原有的数据,一个维度是房间面积,另一个维度是房间所在的楼层。那么PCA之后得到的一个维度,只不过可能是 (0.9 * 房间面积, 0.1 * 所在楼层) 而已,他没有业务意义,也没有特征名称。


在个别领域,看似是有意义的,比如你说的“特征脸”,但这是领域相关的,不是 PCA 自带的性质。这些领域相关的意义,是人为定义的,比如“特征脸”这个词。特征脸之所以能可视化,因为他处理的就是图像领域的问题。是因为他本身处理的就是图像数据,所以我们可以将它很好地直观表达出来;而不是反过来,所有的数据都可以很好地直观表达出来,我只挑了特征脸。


当然,不同领域的数据都可以表达,这就是数据可视化这个领域的意义,已经和 PCA 无关了。


PCA 本质就是做数据压缩,而不是进一步的数据解读或者数据挖掘。实际上,PCA 最大的问题,就是丢掉了原有的数据语义。


可以再参考这里:https://coding.imooc.com/learn/questiondetail/40921.html


继续加油!:)

0
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程