均值方差归一化和最值归一化的优缺
来源:4-7 数据归一化
慕标1049315
2023-02-28
均值方差归一化能处理数据没有明确边界的情况,那么如果数据有明确边界,这两个归一化方法哪个更适合呢?为什么
写回答
1回答
-
liuyubobobo
2023-02-28
基本上数据有明显边界是唯一能用最值归一化的情况。但注意,我的用词是“能用”,而非此时“最值归一化最好”。因为什么叫数值有明显边界其实是一个很主观的概念。(什么叫明显?)
比如人的身高,其实是有明显边界的,超不过 3 米吧?矮不过 0 米吧?但其实对于身高数据来说,在大多数情况下,使用 standardization 是最好的。
如果一定要说最值归一化什么时候最好,可能再加一个限定条件:数据分布均匀(符合完均匀分布)是最好的。但其实,此时,其实最值归一化其实和标准化的效果是差不多的。并且,我们很有可能还是希望做标准化,因为标准化可以保证方差为 1。
在实践中,标准化基本上是最常用且最不会出问题的。因为对于真实数据老说,均匀分布其实不是一种常态,正态分布才是。
继续加油!:)
10
相似问题