良好的调查研究设计寻求减少采样误差
什么是置信区间?
置信区间是指研究人员如果可以询问某个特定研究问题 ,例如目标人群的每个成员,并获得样本成员在调查中给出的相同答案,就会遇到的误差范围。
例如,如果研究人员使用4的置信区间并且60%的调查样本中的参与者回答“会推荐给朋友”,他可以确定在整个目标人群中有54%到64%的成员会当被问及同样的问题时,还会说“会推荐给朋友”。 在这种情况下,置信区间为+/- 4。
什么是置信度?
置信水平表达了研究人员对样本数据的可信度 。 置信水平以百分比表示,表示目标人口百分比给出回答的频率在置信区间内。 最常用的置信度是95%。 一个相关的概念被称为统计显着性。
研究人员对他的样本真实代表目标人群的概率的信心受到许多因素的影响。
研究人员对其研究设计和实施的信心 - 以及对其局限性的认识 - 主要基于三个重要变量:样本量,反应频率和人口规模。 研究人员一直认为在研究计划阶段必须仔细考虑这些变量。
- 样本量一般而言,较大的样本可以提供真实反映目标人群的数据。 宽可信区间表示对数据的置信度较低,因为存在较大的错误余量 。 宽泛的置信区间就像对冲你的赌注。 尽管置信区间和样本量之间存在一定的关系,但它不是线性关系 。 研究人员不能通过加倍样本量来降低一半的置信水平。
- 响应频率样本数据反映目标人群的准确性还取决于以特定方式 给出特定答案或作出答复的答复者的百分比。 提供特定答案的受访者数量越多,表示“非常高兴”,研究人员就可以对此作出回应。 正常曲线中间区域的百分比会有一些变化。 也就是说,如果研究人员有50%的信心, 目标人群的成员会像样本人群中的成员一样(在置信区间内)做出反应,那么这个50%的水平可能会有一些变化。
应该记住, 异常值(正态曲线的远端或尾部的数据)更可能以人口中的相同比率出现,与样本中的相同 - 这里的变异性较小,因为频率较低。 (考虑一下Galton Box中的球在太平洋科学中心的展览中如何往往堆积在中间?只有少数球会反弹到尾巴上。)因此, 对极端答案的频率很自信。
- 除非研究人员正在与他或她知道的非常小的人群(例如足够小以便研究人员可以识别所有人员),否则人口规模并不是样本量的重要因素。
Creative Research Systems指出:
概率的数学证明人口的规模是不相关的,除非样本的规模超过您正在检查的总人口的百分之几。 这意味着500人的样本在审查 1500万人的意见时同样有用,因为它将是一个100,000人的城市。
生成具有代表性的样本可能是一个代价高昂并且耗时的过程。 研究人员总是需要在他们想获得的信心水平或他们需要达到的准确程度以及他们能够承受的信心水平之间进行权衡 。
定性调查研究中的样本量
定性研究本质上是探索性或描述性的,并不关注数字或度量。 但对定性调查研究中抽样误差的担忧仍然有效。 作为一般规则,如果样本是目标宇宙的代表,那么从研究中产生的主题或模式将反映研究人员感兴趣的更大的人口。 如果样本既具有代表性,又由大部分目标人口组成,那么从该样本导出的数据的准确性的置信度就会很高。
确定调查研究中的样本量
在确定样本量时,不同的规则适用于定量研究和定性研究。 一般来说,要对定性调查研究产生的数据充满信心,研究人员需要清楚地了解数据如何使用。 这些数据可能构成描述性叙述(如案例研究或某些民族志研究)的基础,或者可能以探索性方式发现相关变量,以后可能会在定量研究中对相关性进行测试。
定量调查研究中的样本量
定量研究通常涉及目标市场的细分市场或亚组之间的比较。 因为定量研究是数字驱动的,所以确定一个舒适的样本容量可能相当容易 - 对于研究中的每个重要群体或细分群体,研究人员都希望调查100个参与者。 这个数字是一个建议,而不是绝对的。 市场研究员会考虑一些相关变量来确定调查研究中样本的大小。
在进行调查市场调查时,目标是从样本中推断目标宇宙可能是真实的。 样本提供可以观察或已知的数据。 根据这些观察到的或已知的数据,研究人员可以估计在目标人群中可以找到未知值或参数的程度。
定量调查研究基于正常对称曲线的概念,在研究人员的心目中,它代表目标宇宙 - 研究人员必须估算的人群而不是实际知道的参数。 代表性样本允许研究人员根据样本数据计算可能包含未知值或感兴趣参数的估计值范围 。 此估计的值范围表示正常曲线上的面积,通常以小数或百分比表示。
正态曲线和概率
正常的对称曲线是概率的可视表达。 让我们看看一个简单的启发式:科学中心的一项活动让大量的球落在两块压克力板之间,一次一块。 每个球从显示器顶部的同一个开口落下,然后落在任何垂直平行分隔器之间,一旦它们休息,它们就会分离出一堆球。 几个小时后,球形成了正常曲线的形状。 随着每个新引入的球击中大量首先到达的球,曲线稍微改变一点。 但总体而言,对称曲线是明显的,并且自然发生,与科学中心观察员或工作人员的任何行动无关。 球形成的弯曲形状反映了大多数球落入中心并停留在那里的概率。 更少的球会使它进入曲线的尽头 - 有些球不可避免地会出现,但它们数量不多。
这条正常曲线与样本的概念相似。 每当显示器被清空并且球再次被允许落入高尔顿盒时,球堆的配置将仅有点不同。 但随着时间的推移,曲线的形状不会发生太大的变化,并且这种模式也会成立。