老师,请问下什么是极度有偏的数据?

来源:10-9 多分类问题中的混淆矩阵

helloedmund

2018-10-16

和有偏估计是什么关系呢

写回答

1回答

liuyubobobo

2018-10-16

没有统一的界限。整体就是在数据中,一种类别比其他类别少太多(或者多太多)。


比如,通常,正常人群中的疾病数据都是极度有偏的。每100万个人口中,可能只有几十个人感染某种特殊疾病。此时,这个数据就是极度有偏的:)


----------


我们在课程中说的极度有偏的数据,和“有偏估计”一点儿关系都没有。有偏估计是统计学中的一个概念,指对样本的某个特征的估计存在偏差(即估计量的期望值和真值差不为0)。具体可以参考任意统计学课本中的“有偏估计”,“无偏估计”的相关内容:)


加油!:)

0
3
helloedmund
回复
liuyubobobo
谢(:
2018-10-16
共3条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5858 学习 · 2451 问题

查看课程