如问题

来源:3-3 一个数值变量的特征和可视化(上)

慕容2472778

2023-09-16

老师,(16,17]这个半开闭区间上,直方图的高度为什么是频率/区间长度呢?而不直接等于它所对应的频率?如果直接等于它所对应的频率,那么它的面积就是频率*dx了
另外,这种切分是为了极限和积分工具运算方便吗?

写回答

1回答

Angelayuan

2025-02-05

新年好!做直方图的时候,有三种方式,它们对应的Y的含义不同。

  • 如果Y = 频数,那么所有Y加起来等于样本数。一般用于简单的考察数据分布情况。

  • 如果Y = 频率,那么把所有小区间对应的Y值加起来,总和为1。一般用于显示样本比例。

  • 如果Y = 频率/区间长度,面积总和为1。它可以用于近似数据的概率密度函数。可以在上面叠加正态分布曲线或其他理论分布曲线,看看数据是否符合某个已知分布。它的高度也不受区间宽度的影响,也便于概率计算


0
0

专为程序员设计的统计课

清晰的统计学知识网络+与编程结合的讲解方式+数据可视化展示

1625 学习 · 172 问题

查看课程