关于阈值变动后,概率的选择

来源:10-5 精准率和召回率的平衡

lemonlxn

2019-10-09

老师好,在课程中,你通过更改thresholds,来重新分类。如下列代码:

y_predict_2 = np.array(decision_scores >= 5, dtype='int')

但是,predict_proba 这个返回概率的函数,默认thresholds = 0,那请问假如我的thresholds = -5 的话,如何计算当前分类的概率?

写回答

1回答

liuyubobobo

2019-10-09

据我所知,计算不了了。因为修改阈值本身,等于本身已经动了模型中的概率函数。


至少,sklearrn 提供的接口,肯定计算不出来了。但是不是能够应用概率论的知识计算出来,我没有研究过。不同的模型,选取的概率函数本身也不同,不能一概而论了。这超过我的能力范围了。


在机器学习领域,通常,这个具体的概率值,不重要的,因为,阈值是一个超参数,我们通过超参数,希望获得一个更好的预测结果。


当然,如果从统计学的角度,希望获得这个概率值,进行进一步的统计分析,那么完全可以通过修改 predict_proba 的阈值,达到近乎同样的目的。


继续加油!:)

0
1
lemonlxn
好的,谢谢老师,这个概率值感觉有点鸡肋
2019-10-09
共1条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5839 学习 · 2437 问题

查看课程