关于LabelEncoding和MinMaxScaler的问题
来源:5-14 HR表的特征预处理-2

迷途20191129
2019-12-23
老师您好:
在视频(5-14课中),对字段"salary","department"进行LabelEncoding之后,为什么紧接着要对这两个字段进行一次MinMaxScaler的操作呢,视频源代码如下:
scaler_lst=[slr,dp]
column_lst=["salary","department"]
for i in range(len(scaler_lst)):
if not scaler_lst[i]:
if column_lst[i]=="salary":
df[column_lst[i]]=[map_salary(s) for s in df["salary"].values]
else:
df[column_lst[i]]=LabelEncoder().fit_transform(df[column_lst[i]])
df[column_lst[i]]=MinMaxScaler().fit_transform(df[column_lst[i]].values.reshape(-1,1)).reshape(1,-1)[0]
else:
写回答
1回答
-
同学你好,label encode是把离散分类变量数值化,min max是把数值化的结果归一化,前者是方便数值化计算,后者是把特征去掉量纲,方便不同属性间的比较。
022021-08-11
相似问题