老师,请问v的取值为什么是两个相邻X的平均值?取不同权重也没有影响,还是决策树的划分里取的就是平均呢?

来源:12-4 基尼系数

慕妹1247651

2020-10-17

写回答

2回答

慕妹1247651

提问者

2020-10-18

谢谢老师,不用抱歉,我看到上一章您的解释了。但我自己的问题是问这句代码: v = (X[sorted_index[i], d] + X[sorted_index[i-1], d])/2   。就是这里切分点的选择为啥是俩观测的平均值呢?sklearn包里也是按照观测均值来切分的吗?而不是按照一个连续数值循环来算的?

0
2
慕妹1247651
回复
liuyubobobo
十分感谢老师的解答。
2020-10-31
共2条回复

liuyubobobo

2020-10-17

这里课程有误,应该使用加权平均,而非算术平均。可以参考这里:http://coding.imooc.com/learn/questiondetail/68117.html


抱歉!


继续加油!:)

0
0

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程