抽样研究是指从总体中按照随机化的原则,抽取一定数量的个体组成样本进行研究,从而推断总体的研究方法。在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一部分,因此计算的样本统计量,不一定恰好等于相应的总体参数。这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(sampling error),同样,来自同一总体的若干样本的统计量之间,也会存在误差,这种误差也反映在样本统计量与总体参数间的差异。当样本是来自相应总体的随机样本时,抽样误差为随机误差,其误差大小可以依据中心极限定理进行估计。中心极限定理的内容是,以数值变量资料为例,若从均数为μ的正态总体中以固定n反复多次(比如100次)抽样时医|学教育网整理,所得的样本均数的分布是正态分布;即使是从偏态总体中抽样,只要足够大,的分布也近似正态分布。
在抽样研究中抽样误差是不可避免的,根据资料的性质和指标种类的不同,抽样误差有多种,例如:①从某地7岁男童中随机抽取110名,测得平均身高为119.95cm,该样本均数不一定等于该地7岁男童身高的总体均数,这种样本均数与总体均数间的差别,称为均数的抽样误差。②某县为血吸虫病流行区,从该县人群中随机抽取400人,测得的血吸虫感染人数为60人,感染率为15%,该样本率不一定等于该地人群的总体感染率。此为样本率与总体率之间的差别,称为率的抽样误差。此外,样本方差和相应的总体方差也存在抽样误差,卫生统计学中的相关系数和回归系数也有抽样误差的问题。