为啥是最大值呢?万一是异常值呢?

来源:3-7 极端值与缺失值

Ivan8612668

2021-02-05

图片描述

写回答

1回答

Angelayuan

2021-02-07

非常好的问题。到底用哪一种方法来处理缺失值要具体问题具体分析。如你所说的情况下,一组数据中的最大值如果是极端值,用对极端值不敏感的中位数或众数来替代缺失值是更好的选择(均值受极端值影响大);但是由于一组数据的极端值的判断受到所有数据的影响,也有可能“最大值”在处理缺失值之前是极端值,用来替代了缺失值之后,在所有数据中就不是极端值了。在课程里,我只是告诉大家在实践中可以用哪些数字特征来对极端值进行替代。到底挑选其中的哪一个一定要具体问题具体分析哦!加油?

1
3
Angelayuan
回复
Ivan8612668
可以看一下儿这篇文章,里面列举了一些用不同方法替代缺失值的例子:https://blog.csdn.net/lujiandong1/article/details/52654703
2021-02-27
共3条回复

专为程序员设计的统计课

清晰的统计学知识网络+与编程结合的讲解方式+数据可视化展示

1605 学习 · 145 问题

查看课程