均值方差归一化和最值归一化的优缺

来源:4-7 数据归一化

慕标1049315

2023-02-28

均值方差归一化能处理数据没有明确边界的情况,那么如果数据有明确边界,这两个归一化方法哪个更适合呢?为什么

写回答

1回答

liuyubobobo

2023-02-28

基本上数据有明显边界是唯一能用最值归一化的情况。但注意,我的用词是“能用”,而非此时“最值归一化最好”。因为什么叫数值有明显边界其实是一个很主观的概念。(什么叫明显?)


比如人的身高,其实是有明显边界的,超不过 3 米吧?矮不过 0 米吧?但其实对于身高数据来说,在大多数情况下,使用 standardization 是最好的。


如果一定要说最值归一化什么时候最好,可能再加一个限定条件:数据分布均匀(符合完均匀分布)是最好的。但其实,此时,其实最值归一化其实和标准化的效果是差不多的。并且,我们很有可能还是希望做标准化,因为标准化可以保证方差为 1。


在实践中,标准化基本上是最常用且最不会出问题的。因为对于真实数据老说,均匀分布其实不是一种常态,正态分布才是。


继续加油!:)

1
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程