如何用代码实现用一个值替代箱里的数据
来源:5-7 特征变换-离散化

杰哒哒
2018-10-11
老师,你在视频里说,在进行等深分箱的时候,可以用一个值来代替箱里的数据,例如均值,请问这个如果用代码去实现呢?还是用pd.qcut和pd.cut吗?是要往里面添加什么参数吗?
写回答
1回答
-
途索
2018-10-12
同学你好,在pandas的qcut或者cut中,还没有参数直接替换分箱后的各个箱子里的指定替代值,所以这样的操作得我们自己实现。自己实现可以分三步进行,一是在qcut后用Series根据获得的label进行concat,二就是对合成的新表进行groupby操作(这里可以用我们常用的聚合函数进行聚合),三就是用新值直接替换原表值即可。
10
相似问题