关于下一节Gini系数公式
来源:4-9 分组分析方法与实现

奶茶真的不好喝
2018-11-04
老师您好,我在这儿看到Gini系数的公式是如下的但是在下一节的代码实现中
最后这个return的部分,为什么需要乘上*len(d[k])/float(len(s1))?从公式来看并没有需要用到这个概率呀
谢谢!
写回答
1回答
-
途索
2018-11-05
同学你好,公式里count x|y / count y指y条件下x的数量,除上y的数量。getprobss得到的是条件概率,乘上数量len(d[k])就是count x|y,除以s1的数量(就是count y),得解。
042018-11-08
相似问题