什么是分层随机样本?

所有关于分层随机抽样

分层随机样本是一种概率抽样程序。 这类样本的两个基本部分是:1)它是分层的,2)它是概率的。 那么这究竟是什么意思,为什么它很重要? 分层随机样本也称为比例随机抽样或配额随机抽样。

什么是分层随机抽样?

样本是较大人口的微型代表。

样本可以非正式或正式确定。 但是,根据某些科学方法 系统开发的样本通常被认为对更广泛群体的推广更有用。

分层意味着什么?

分层样本包括被认为在重要方面不同的同质子群。 这些同质子群的集合被称为分层。 这种抽样程序的方法使人口可以分为均质的小组,从中可以选择简单的随机样本。

为什么分层样本有用?

分层随机抽样的目的是从不同亚组中选择参与者,这些亚组被认为与将要进行的研究有关。 例如,研究结果可能受到学科属性的影响 ,如年龄,性别,工作经验水平,种族和族群,经济状况,受教育程度等等。

分层样本的构建使得这些潜在的影响特征可以合理地假设为反映总人口中这些特征的模式。 通过这种方式,样本反映了从中获取的人口,但样本不能说是代表较大的人口

请记住,分层样本成员的选择不是一个随机过程。 也就是说,一旦建立了地层,就使用简单的随机抽样来为每个地层选择样本的成员。

概率是什么意思?

分层随机样本是概率的,因为用于选择样本群体的每种方法都提供了合理可靠的方式来估计样本群体对选择样本的较大(宇宙)群体的代表程度。 换句话说, 概率样本允许研究人员估计样本选择的确切或不代表样本被抽取的较大群体的几率

例子

同质亚群和整个较大样本群体之间的差异感兴趣时,采用分层随机抽样方法。

假设一群商业客户可分为三组:Gen-Xers,Gen-Yers(千禧年)和婴儿潮一代。 此外,我们有理由相信,Gen-Xers和Gen-Yers都是整体商业客户中相对较小的少数群体。 Gen-Xers约占客户总人口的5%,Gen-Yers约占客户总数的10%。

如果我们使用10%的抽样比例,100个成员(n = 100)的简单随机样本可能会生成5个Gen-Xers和10个Gen-Yers。 只有偶然才有可能获得更少的Gen-Xers和更少的Gen-Yers。 分层可能会产生更具代表性的结果。 假设我们想每组至少有25人。 如果我们仍然抽样100人(n = 100),那么我们可以抽样25名Gen-Xer,25名Gen-Yers和50名婴儿潮一代。

我们知道,百分之十的人口是千禧一代或一代人(或约100名客户),随机抽样的25名客户将提供25/100或25%的阶层内抽样比例,我们也知道5% 50名不是婴儿潮一代的客户是Gen-Xers,这意味着阶层分数将是25/50或50%。

因此,50位Gen-Xers加上100位Gen-Yers总计150位客户。 由于客户总人数为1000人,因此我们将Gen-Xers加上Gen-Yers(总共150位客户)减去850名客户,他们是婴儿潮一代。 婴儿潮一代的阶层抽样比例为50/850或约5.88%。

有两件事情是显而易见的:(1)这三组在整个人群中更为同质 。 这意味着方差较小,这为提高统计精度提供了机会。 (2)由于样本已经分层,所以每个组中都有足够的成员能够进行有意义的小组推理

分层抽样可能优于简单随机抽样,因为当代表总体人口和代表人口的关键子群体时尤其如此,尤其是当子群体非常小但以重要方式区分时。 通过使用分层抽样方法,研究人员可以有效地确保在讨论研究结果时可以区分亚组