抽样误差与非抽样误差

由 范文之家 分享时间：2022-11-17 23:31:16 加入收藏我要投稿点赞

抽样误差与非抽样误差

二、抽样误差与非抽样误差

由于抽样调查中不可能搜集到每一个个体的准确的信息，而得到的是总体中的一部分个体的信息特征，并由这些信息来对总体的特征进行推断，所以这个推断的结果会和总体的实际特征有一定的误差。一般来说通过样本获取的信息进行的推断的结果会受到两种误差的影响。这两种误差就是抽样误差和非抽样误差。

抽样误差是指样本指标和总体指标之间数量上的差别。抽样调查是用样本指标来推断总体指标的一种调查的方法，而这种推断的主要依据就是抽样误差。因此怎样计算、使用和控制抽样误差是抽样调查的一个重要问题。对于抽样误差的理解可以从两个方面来入手：

第一，抽样误差是指由于抽样的随机性而产生的那一部分代表性的误差，不包括由于问卷数据录入的误差，而是指遵循了随机原则但可能抽取到不同的样本而产生的误差。抽样误差在抽样调研中是必然会产生的，但是我们可以通过统计学的一些公式来进行计算，并设法加以控制。

第二，抽样误差应该包括两种：实际误差和抽样平均误差。实际误差是一个样本指标与总体指标之间的差别，这类误差我们是无法知道的。抽样平均误差是指所有可能出现的样本指标的标准差，也可以说是所有可能出现的样本指标和总体指标的平均误差，抽样平均误差是可以计算的。

非抽样误差，也叫测量误差，是指除抽样误差之外的各种误差的总和。引起非抽样误差的原因很多，比如抽样框不齐全，访问员工作经验有限，被访者不配合访问而加以虚假的回答，问卷设计本身存在缺陷，等等。应该说非抽样误差的产生贯穿了调查的每一个环节，任何一个环节出错都有可能导致非抽样误差增加而使数据失真。我们平时说的控制误差主要指的就是控制非抽样误差。

一般而言，非抽样误差可以分为三类，分别是：抽样框误差、无回答误差和计量误差。

所谓的抽样框误差指目标总体和抽样总体不一致时产生的误差。理想的抽样框需要满足以下要求，就是所有的抽样单位必须覆盖目标总体，对于较为简单的单阶段抽样，抽样框要求每个目标总体单位都应该对应着一个抽样单位，抽样单位必须相互独立，互不重叠，并且惟一地与目标总体相连接。如果目标总体与抽样总体不一致时就产生了抽样框误差。

无回答误差就是指数据丢失，数据丢失的原因有两种：一是有意不回答；二是无意不回答。有意识不回答，主要指被调查者拒绝访问或拒绝就某一个问题给予回答。无意识不回答则可能是由于受访者不在家或者是访问者疏忽，导致数据遗漏。

计量误差可以分为三类：一是问卷设计阶段产生的误差；二是调查阶段产生的误差；三是其他误差。

问卷设计产生的误差，主要来自于不同措辞的不同表达、不同问题的顺序和间隔，以及问卷设计过长，导致访问者疲劳而产生数据失真的现象。

调查阶段产生的计量误差来自于两个方面：一是访问员有意或无意导致数据失真；二是被访者有意或无意导致数据失真。受访者无意使数据失实主要的原因是，理解错误和记忆误差等。

其他计量误差包括，随机数字表的编制和使用，数据处理过程中（包括编码、录入）发生的误差等等。这些误差都可以通过比较有效的质量控制来加以限制。