老师,请教总体、个体、样本的分布关系

来源:6-1 总体与样本

Jazz_Qi

2019-08-13

下面是我用举列子的方式来问问题,请老师看看:

背景:总体设为某城市某一手楼盘在2019年成交的500套房的单价,想通过抽样了解总体分布

问题1:你说总体可当作是一个随机变量,其分布是否就是对应这500套成交的房的单价的分布图?

每一套成交的房子的单价是一个个体,作为调研人员无法得到500套房的成交信息,只能随机抽样50个个体,每次观察一个个体前这个个体也有自己的可能性集合,观察后这个个体的值就确定了。

问题2:500套的单价分布≈每一个个体在观察前的单价可能性集合的分布≈样本(50个体)的单价分布。≈的说法比较不严谨,但不知道怎么描述好。

写回答

1回答

Angelayuan

2019-08-14

先解释清楚定义:总体就是这500套房子(直接说成是500套房子的房价也可以),一个个体就是这500套房子中的一套房子(或者说成是一套房子的房价)。一个样本是由这500套房子中的若干房子组成的,由于你让样本容量为50,所以一个样本就包含50个个体。

然后是对你的问题的回答:

  1. 是的,总体的分布,就是这500套房子的单价的分布。对于一套房子来说,在你对其单价进行观测前,这套房子的单价可能的取值及其概率 与总体的分布是一样的。而一旦你记录了房价,这套房子的单价就确定了,也就是所谓的这个个体上得到的观察值。

  2. 500套房子单价的分布 是总体分布;每一个个体在观察前其单价的可能性及概率与总体一致。所以你的第一个“约等于”是正确的。但是你的第二个"约等于"不完全正确。当样本容量比较小的时候,样本的分布可能跟总体的分布非常不一样,因为小样本提供的信息非常有限,并且抽样过程可能会有各种误差。随着样本容量的增大,样本的分布与总体的分布的相似性会逐渐增大。在课程中,我们有讲到,如果抽取多个样本(样本容量固定),对每一个样本计算样本均值,那么这些样本均值并不是相等的,而是近似服从正态分布。这也进一步说明,基于样本得到的信息是具有不确定性的。下一章,我们会讲如何对这种不确定性进行刻画。

继续加油!

2
1
Jazz_Qi
谢谢老师。
2019-08-14
共1条回复

专为程序员设计的统计课

清晰的统计学知识网络+与编程结合的讲解方式+数据可视化展示

1605 学习 · 145 问题

查看课程