老师,请教11-4的Boostrap和Premutation的区别。
来源:11-4 Permutation
Jazz_Qi
2019-10-23
1、Boostrap和Premutation有很多相似的地方,都是对已有的样本重复利用,而且您所举的例子上面几乎是一样的问题两个角度分析,一个是中位数差的分布,另一个是假设为真时的中位数差的分布。老师您能不能在多说一下两者区别和不同使用场景上的选择?
2、老师您说Boostrap能够帮助确定区间估计,但感觉您举的Premutation例子也是可以的,那Premutation是否也可以帮助区间估计?
3、老师您说Premutation有普适性,能用到很多其他自己构造的统计量中,那么Boostrap也会有普适性吗?
1回答
-
Bootstrap中保留了数据的真实标签, 比如我们resample的时候,从男性样本中抽取男性的数据, 从女性样本中抽取女性数据; 我们只是暂时把原样本当成"总体", 然后从中进行抽样。而Permutation最重要的一步就是在零假设为真的情况下进行各种计算; 当零假设为真的时候, 数据的真实标签就不重要了(因为零假设认为男女数据都是来自同一个总体的), 所以数据的真实标签就被随机化了。在permutation下,我们构建的是零假设对应的经验分布。其实bootstrap和permutation都属于resampling methods。这个链接里有一些内容讲得也很好, 而且还谈到了更多的resampling方法,有兴趣你可以看看https://stats.stackexchange.com/questions/104040/resampling-simulation-methods-monte-carlo-bootstrapping-jackknifing-cross
Permutation不可以。因为permutation的重要条件之一就是认为零假设为真, 那么字面意思,真值就是零假设里的那个值,不用再估计了。
Permutation和Bootstrap都具有比较广泛的适用性。但还是那句话, 即使对某些可以使用permutation和boostrap的情况,也应该先考察是否可以使用参数方法来进行假设检验。如果可以使用参数方法,还是优先选择参数方法,因为有更大的统计功效。题外话,也存在参数bootstrap方法,在1的链接中就有讲到,有兴趣可以看看。
212019-10-23
相似问题
回答 1
回答 1