关于下一节Gini系数公式

来源:4-9 分组分析方法与实现

奶茶真的不好喝

2018-11-04

老师您好,我在这儿看到Gini系数的公式是如下的
图片描述但是在下一节的代码实现中
图片描述最后这个return的部分,为什么需要乘上*len(d[k])/float(len(s1))?从公式来看并没有需要用到这个概率呀
谢谢!

写回答

1回答

途索

2018-11-05

同学你好,公式里count x|y / count y指y条件下x的数量,除上y的数量。getprobss得到的是条件概率,乘上数量len(d[k])就是count x|y,除以s1的数量(就是count y),得解。

0
4
途索
回复
奶茶真的不好喝
转了个弯,也多谢你的体谅啦
2018-11-08
共4条回复

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程