特征归一化要考虑特征权重吗?
来源:4-8 scikit-learn中的Scaler
chanchan666
2020-01-28
不管是最值归一,还是均值方差归一的方法,都是将数据所有特征统一成相同维度。前提是这些特征的权重都是相同的,如果有些特征权重不等呢?有的特征比较重要,有的特征没那么重要呢。比如在评选信用的时候,收入,银行流水,资产很重要,但年龄相对没那么重要。
写回答
1回答
-
考虑权重不是归一化算法的任务,是机器学习算法的任务。
以线性回归为例,一个权重高的特征,其求解出的 theta 系数,就会大一些;而一个权重低的特征,其求解出的 theta 系数,就会小一些。
一个特征到底重要不重要,有多重要,和最终的 label(y 值是)关系是怎样的,即 x 是怎样决定 y 的,这恰恰是机器学习算法要解决的任务:)
归一化算法的目的,是让机器学习算法在决定这个关系之前,给机器学习算法统一的度量参考。
继续加油!:)
10
相似问题