关于LabelEncoding和MinMaxScaler的问题

来源:5-14 HR表的特征预处理-2

迷途20191129

2019-12-23

老师您好:
在视频(5-14课中),对字段"salary","department"进行LabelEncoding之后,为什么紧接着要对这两个字段进行一次MinMaxScaler的操作呢,视频源代码如下:

	scaler_lst=[slr,dp]
column_lst=["salary","department"]
for i in range(len(scaler_lst)):
	if not scaler_lst[i]:
		if column_lst[i]=="salary":
			df[column_lst[i]]=[map_salary(s) for s in df["salary"].values]
		else:
			df[column_lst[i]]=LabelEncoder().fit_transform(df[column_lst[i]])
		df[column_lst[i]]=MinMaxScaler().fit_transform(df[column_lst[i]].values.reshape(-1,1)).reshape(1,-1)[0]
	else:
写回答

1回答

途索

2019-12-24

同学你好,label encode是把离散分类变量数值化,min max是把数值化的结果归一化,前者是方便数值化计算,后者是把特征去掉量纲,方便不同属性间的比较。

0
2
慕粉1473427710
老师好,请问One Hot编码后的数值为什么不用归一化呢,不用考虑量纲的影响吗
2021-08-11
共2条回复

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程