判断极端值的科学依据是什么?

来源:3-7 极端值与缺失值

那月真美

2025-03-07

老师,为什么说某个数据小于Q1-1.5IQR 或者 大于 Q3+1.5IQR就是疑似极端值呢?这个是疑似极端值的定义吗?

写回答

1回答

Angelayuan

2025-04-10

没有具体的定义,在不同的领域,极端值的定义会不同。


如果一定要找一个定义,通常从传统统计学的角度,如果认为一个变量服从正态分布,那么在三个标准差以外的值,就可以认为是极端值。


但依然是,并不是所有变量都服从正态分布,即使服从正态分布,根据你的领域,所处理的数据,或者是所处理的任务不同,对极端值得定义也可能不同。也正因为如此,有类似极端值检测(异常检测)一类的算法,而不是用一个通用的定义就能找到所有极端值。


继续加油!:)

0
0

专为程序员设计的统计课

清晰的统计学知识网络+与编程结合的讲解方式+数据可视化展示

1633 学习 · 173 问题

查看课程