老师,请教总体、个体、样本的分布关系
来源:6-1 总体与样本
Jazz_Qi
2019-08-13
下面是我用举列子的方式来问问题,请老师看看:
背景:总体设为某城市某一手楼盘在2019年成交的500套房的单价,想通过抽样了解总体分布
问题1:你说总体可当作是一个随机变量,其分布是否就是对应这500套成交的房的单价的分布图?
每一套成交的房子的单价是一个个体,作为调研人员无法得到500套房的成交信息,只能随机抽样50个个体,每次观察一个个体前这个个体也有自己的可能性集合,观察后这个个体的值就确定了。
问题2:500套的单价分布≈每一个个体在观察前的单价可能性集合的分布≈样本(50个体)的单价分布。≈的说法比较不严谨,但不知道怎么描述好。
1回答
-
先解释清楚定义:总体就是这500套房子(直接说成是500套房子的房价也可以),一个个体就是这500套房子中的一套房子(或者说成是一套房子的房价)。一个样本是由这500套房子中的若干房子组成的,由于你让样本容量为50,所以一个样本就包含50个个体。
然后是对你的问题的回答:
是的,总体的分布,就是这500套房子的单价的分布。对于一套房子来说,在你对其单价进行观测前,这套房子的单价可能的取值及其概率 与总体的分布是一样的。而一旦你记录了房价,这套房子的单价就确定了,也就是所谓的这个个体上得到的观察值。
500套房子单价的分布 是总体分布;每一个个体在观察前其单价的可能性及概率与总体一致。所以你的第一个“约等于”是正确的。但是你的第二个"约等于"不完全正确。当样本容量比较小的时候,样本的分布可能跟总体的分布非常不一样,因为小样本提供的信息非常有限,并且抽样过程可能会有各种误差。随着样本容量的增大,样本的分布与总体的分布的相似性会逐渐增大。在课程中,我们有讲到,如果抽取多个样本(样本容量固定),对每一个样本计算样本均值,那么这些样本均值并不是相等的,而是近似服从正态分布。这也进一步说明,基于样本得到的信息是具有不确定性的。下一章,我们会讲如何对这种不确定性进行刻画。
继续加油!
212019-08-14
相似问题