gini系数计算疑问

来源:4-9 分组分析方法与实现

兰陵笑笑生zl

2021-10-15

http://img.mukewang.com/szimg/6168fcd50938fa7410000420.jpg

老师上面是Gini系数的计算公式,下面是您写的代码

http://img.mukewang.com/szimg/6169013f09b714dd08140054.jpg

我觉得有点问题,代码应该只需要这样就够了吧

1-sum([getProbss(d[k]) for k in d])


写回答

1回答

途索

2021-11-01

同学你好,gini系数计算的时候,是需要考虑样本数量加权的。原始公式没标出来是不考虑样本数量加权的结果,训练模型时是需要考虑的。

0
0

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程