老师,你好,请问demean处理是属于数据预处理的内容吗
来源:7-3 求数据的主成分PCA

慕运维7479159
2018-06-17
老师,你好,请问demean处理是属于数据预处理的内容吗
是属于特征工程的内容吗,如果现有的数据不符合demean标准,必须经过预处理,并且不能够进行 方差为1的处理
这个好像是课程中讲到的,这样理解对吗,不急着使用,改天回答也可以,老师节日快乐
写回答
1回答
-
什么是“数据预处理”,什么是“特征工程”,这个分界点还真没有特别严格的划分:)通常,我倾向于把demean归为“数据预处理”,因为这个过程并没有对我们数据的“特征”产生任何“新”的变化,指数所有数据的数值平移了一下而已(好比只是单位变化了一下,或者把100分制转换成了10分制而已)
由于StandardScalar(标准化)的过程,将数据的每一维度的特征,都转换成了均值为0,方差为1的分布,所以,通常,我们做一遍数据标准化,再通过PCA是没有任何问题的。当然了,由于demean是PCA必须的步骤,所以在我们的PCA内部,也封装了demean的过程。对于已经标准化的数据,这步demean其实没有发挥作用,但也不妨碍,毕竟要预防用户把没有经过标准化的数据也扔进了PCA的过程:)
对于我们的PCA内部封装了demean的过程,可以以下课程代码第46行:https://github.com/liuyubobobo/Play-with-Machine-Learning-Algorithms/blob/master/07-PCA-and-Gradient-Ascent/05-Data-Projection/playML/PCA.py
节日快乐:)加油!
012018-06-19
相似问题