关于OneHotEncoding 后出现的结果不理解

来源:5-14 HR表的特征预处理-2

weixin_慕村7125053

2019-12-29

图片描述
老师,您好,我这里有个问题不明白,按照OneHotEncoding的原则,不应该是转化后,department属性下,每个部门对应的向量中不应该只有一个1吗?是否是因为这里用的是df.get_dumpies()进行转化导致的出现多个1,还是我的理解存在什么不当的地方?

写回答

1回答

途索

2019-12-30

同学你好,one hot后,代表每个类别下只有一个1,你要横着数。比如,红色,白色,绿色,编码后变成,100,010,001。如果有两条数据,都是红色,当然是100,100竖着看是两个1,横着看就是一个1。one hot是扩充维度的操作,列变多了。

0
1
weixin_慕村7125053
谢谢老师,理解了。
2020-01-03
共1条回复

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程