特征归一化要考虑特征权重吗?

来源:4-8 scikit-learn中的Scaler

chanchan666

2020-01-28

不管是最值归一,还是均值方差归一的方法,都是将数据所有特征统一成相同维度。前提是这些特征的权重都是相同的,如果有些特征权重不等呢?有的特征比较重要,有的特征没那么重要呢。比如在评选信用的时候,收入,银行流水,资产很重要,但年龄相对没那么重要。

写回答

1回答

liuyubobobo

2020-01-28

考虑权重不是归一化算法的任务,是机器学习算法的任务。


以线性回归为例,一个权重高的特征,其求解出的 theta 系数,就会大一些;而一个权重低的特征,其求解出的 theta 系数,就会小一些。


一个特征到底重要不重要,有多重要,和最终的 label(y 值是)关系是怎样的,即 x 是怎样决定 y 的,这恰恰是机器学习算法要解决的任务:)


归一化算法的目的,是让机器学习算法在决定这个关系之前,给机器学习算法统一的度量参考。


继续加油!:)

1
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程